40067

Создание лексико-семантической основы ИПЯ. Часть 1. Отбор и нормализация лексики

Лабораторная работа

Информатика, кибернетика и программирование

Требования к отчету: Итоги выполнения задания представить в виде таблицы 1 Таблица 1 Способы достижения однозначности лексических единиц в ИПЯ Наименование ИПЯ Наименование элемента организационной структуры Устранение синонимии Устранение многозначности 1. Выявить все использованные в заданном ИПЯ ссылки для устранения синонимии: см. Привести примеры использования в заданном ИПЯ различных способов устранения полисемии и омонимии: развертывание слова до словосочетания и лексикографический способ.

Русский

2013-10-15

49 KB

9 чел.

Лабораторная работа 4

4 часа

Создание лексико-семантической основы ИПЯ. Часть 1. Отбор и нормализация лексики

Цель работы: Познакомиться с методами отбора и нормализации  лексических единиц.

Задачи работы: 1. Овладеть методикой выделения ключевых слов в текстах;

                            2. Изучить способы  устранения синонимии, полисемии,

                                омонимии;

                            3. Приобрести навыки нормализации лексики.

Обеспечивающие средства: тексты первичных и вторичных документов; карточки для записи ключевых слов; справочные издания; информационно-поисковые языки (УДК, ББК, ГРНТИ).

Задание 1:  Выявить способы достижения  однозначности лексических единиц в информационно-поисковых языках.

Требования к отчету: Итоги выполнения задания представить в виде таблицы 1

         Таблица 1

Способы достижения  однозначности лексических единиц в ИПЯ

Наименование ИПЯ

Наименование элемента организационной структуры

Устранение синонимии

Устранение многозначности

1. УДК

АПУ

Морские огурцы см. Голутории

Дерево см. также Древесина

Рыболовство

  •  (лесное хозяйство)
  •  (сельское хозяйство)
  •  (спорт)

Основные таблицы

004.71 Сетевая аппаратура

  621.39 Телекоммуни-кационное оборудование

        004.355.085.22 Накопители на оптических компакт-дисках (CD-ROM)

659.2 Система информации. Справки (реклама)

Технология работы:

  1.  Проанализировать основные таблицы и АПУ к таблицам УДК, ББК, ГРНТИ.
  2.  Выявить все использованные в заданном ИПЯ ссылки для устранения синонимии: см., см. также, экв. Привести примеры.
  3.  Привести примеры  использования  в заданном ИПЯ различных  способов  устранения полисемии и омонимии: развертывание слова до словосочетания и  лексикографический способ.

Задание 2:  Проанализировать проявление многозначности в естественном языке.

Требования к отчету: Итоги выполнения задания представить следующим образом:

  1.  Байка – мягкая ворсистая хлопчато-бумажная ткань.
  2.  Байка – побасенка, выдумка, басня.

ОМОНИМИЯ.

Технология работы:

  1.  Используя справочную литературу (словари, справочники, энциклопедии),  найдите заданное понятие (см. табл.2)  и выпишите его определения.
  2.  Назовите обнаруженное явление: омонимия, полисемия. Объясните причины его возникновения.

Таблица 2

Перечень лексических единиц

Вариант - 1

Вариант –2

Вариант-3

Вариант-4

Знак запятая

Символ

Знак точка

Код

Классификационная система

Схема классификации

Генератор отчетов

Акцептор

Задача

Блок

Команда

Блок-маркер

Генератор

Путь

Показатель

Метка

Аттестат

Ленивец

Бумага

Диверсия

Франк

Фаланга

Струг

Буфет

Задание 3: Осуществить  информационный анализ массива документов с целью выявления ключевых слов.

Требования к отчету: Итоги выполнения задания представить в виде массива карточек, оформленных следующим  образом:

 

Технология работы:

  1.  Проанализировать заданные документы и   выделить ключевые слова.
  2.  Провести лексикографическую обработку лексики, обеспечив стандартизацию записи выделенных  лексических единиц: исчисляемые понятия записываются в форме множественного числа, неисчисляемые – в той форме, в которой принято использовать; если ключевое слово представлено словосочетанием, то оно записывается в инверсированной форме.
  3.  Каждое ключевое слово записать на отдельную карточку с указанием того номера документа, в котором оно присутствует.

Задание 4:  Провести нормализацию лексики.

Технология работы:

  1.  В массиве ключевых слов, полученном в ходе выполнения  задания 3,   выделить слова-синонимы и многозначные слова.
  2.  С помощью отсылок и помет устранить синонимию и многозначность. Например:

Устранение синонимии:  Подчиненный директорий  см. Подкаталог

Устранение многозначности:

                      Технологии библиотечные

                      Технологии информационные

                      Технологии программирования

                            Библиография (деятельность)

                            Библиография (наука)

                            Библиография (указатель литературы)

  1.  Расставить  полученный массив карточек в алфавитном порядке.

Контрольные вопросы

  1.  Каким требованиям должен соответствовать словник ИПЯ?
  2.  Каковы последствия несоблюдения требований однозначности лексических единиц в ИПЯ?
  3.  Установите общие и отличительные признаки таких понятий, как «ключевое слово», «термин», «лексическая единица».

Список рекомендуемой литературы

  1.  Гендина Н.И. Лингвистическое обеспечение автоматизированных библиотечных систем. – Алма-Ата: Гылым, 1991. – С. 64-77.
  2.  Гендина Н.И., Скипор И.Л. Лингвистические основы информатики: Гипертекстовый учебный терминологический словарь-справочник. – Кемерово: Кузбассвузиздат, 2002.-124 с.


 

А также другие работы, которые могут Вас заинтересовать

77681. Мониторы. Виды мониторов и их преимущества 108 KB
  Жидкий кристалл – это специфическое агрегатное состояние вещества, в котором оно проявляет одновременно свойства кристалла и жидкости. Сразу надо оговориться, что далеко не все вещества могут находиться в жидкокристаллическом состоянии.
77682. Цивилизационная концепция Н. Я. Данилевского 89.5 KB
  Исторические события ХХ века поставили под сомнение многие, казалось бы, прочно утвердившиеся научные концепции общественного развития. Прежде всего это относится к теориям общего для всего человечества постиндустриального развития, связанного с прогрессом развития средств производства...
77683. SATA 428.5 KB
  Теоретически ST 150 и ST 300 устройства должны быть совместимы как ST 300 контроллер и ST 150 устройство так и ST 150 контроллер и ST 300 устройство за счёт поддержки согласования скоростей в меньшую сторону однако для некоторых устройств и контроллеров требуется ручное выставление режима работы например на НЖМД фирмы Segte поддерживающих ST 300 для принудительного включения режима ST 150 предусмотрен специальный джампер. Разъём питания ST подаёт 3 напряжения питания: 12 В 5 В и 33 В; однако современные устройства могут...
77685. Устройство накопителя на жестких магнитных дисках 1.79 MB
  Головка чтения/записи в любом дисковом накопителе состоит из U-образного ферромагнитного сердечника и намотанной на него катушки (обмотки), по которой может протекать электрический ток. При пропускании тока через обмотку в сердечнике (магнитопроводе) головки создается магнитное поле. При переключении направления протекающего тока полярность магнитного поля также изменяется. В сущности, головки представляют собой электромагниты
77686. ОРГАНИЗАЦИЯ ЖЕСТКИХ ДИСКОВ 1.12 MB
  Функции BIOS для работы с жесткими дисками. Проблемы BIOS при работе с большими дисками. Структурная схема жесткого диска. Вдоль каждой поверхности каждого диска синхронно перемещаются магнитные головки обеспечивающая чтение и запись информации.
77687. Устройство жесткого диска 376 KB
  Накопитель на жестких магнитных дисках состоит из четырех главных элементов, каждый из которых вносит свой вклад в его общие характеристики. НЖМД состоит из собственно носителя (пакета дисковых пластин - платтеров, вращающихся наоси)
77688. Характеристики Жестких дисков 144.5 KB
  За 45 лет прошедших с момента появления первых устройств магнитного хранения данных поверхностная плотность записи выросла более чем в пять миллионов раз. Емкость накопителя С декабря 1998 года Международная электротехническая комиссия МЭК занимающаяся стандартизацией в области электротехники представила в качестве официального стандарта систему названий и символов единиц измерения для использования в области обработки и передачи данных. На основании этого значения можно сделать вывод об эффективности того или иного способа записи...
77689. Физические основы магнитной записи сигналов 37 KB
  Эти объемы называемые доменами обладают магнитным моментом самопроизвольной намагниченностью даже при отсутствии внешнего намагничивающего поля. Для ферромагнетиков характерен гистерезис при перемагничивании внешним магнитным полем то есть запаздывание изменений намагниченности вещества при изменении намагничивающего поля. 1 приведена основная характеристика ферромагнетиков зависимость магнитной индукции В от напряженности Н намагничивающего поля так называемая петля гистерезиса. Петля гистерезиса ферромагнетика и ее особые точки Если...