40067

Создание лексико-семантической основы ИПЯ. Часть 1. Отбор и нормализация лексики

Лабораторная работа

Информатика, кибернетика и программирование

Требования к отчету: Итоги выполнения задания представить в виде таблицы 1 Таблица 1 Способы достижения однозначности лексических единиц в ИПЯ Наименование ИПЯ Наименование элемента организационной структуры Устранение синонимии Устранение многозначности 1. Выявить все использованные в заданном ИПЯ ссылки для устранения синонимии: см. Привести примеры использования в заданном ИПЯ различных способов устранения полисемии и омонимии: развертывание слова до словосочетания и лексикографический способ.

Русский

2013-10-15

49 KB

9 чел.

Лабораторная работа 4

4 часа

Создание лексико-семантической основы ИПЯ. Часть 1. Отбор и нормализация лексики

Цель работы: Познакомиться с методами отбора и нормализации  лексических единиц.

Задачи работы: 1. Овладеть методикой выделения ключевых слов в текстах;

                            2. Изучить способы  устранения синонимии, полисемии,

                                омонимии;

                            3. Приобрести навыки нормализации лексики.

Обеспечивающие средства: тексты первичных и вторичных документов; карточки для записи ключевых слов; справочные издания; информационно-поисковые языки (УДК, ББК, ГРНТИ).

Задание 1:  Выявить способы достижения  однозначности лексических единиц в информационно-поисковых языках.

Требования к отчету: Итоги выполнения задания представить в виде таблицы 1

         Таблица 1

Способы достижения  однозначности лексических единиц в ИПЯ

Наименование ИПЯ

Наименование элемента организационной структуры

Устранение синонимии

Устранение многозначности

1. УДК

АПУ

Морские огурцы см. Голутории

Дерево см. также Древесина

Рыболовство

  •  (лесное хозяйство)
  •  (сельское хозяйство)
  •  (спорт)

Основные таблицы

004.71 Сетевая аппаратура

  621.39 Телекоммуни-кационное оборудование

        004.355.085.22 Накопители на оптических компакт-дисках (CD-ROM)

659.2 Система информации. Справки (реклама)

Технология работы:

  1.  Проанализировать основные таблицы и АПУ к таблицам УДК, ББК, ГРНТИ.
  2.  Выявить все использованные в заданном ИПЯ ссылки для устранения синонимии: см., см. также, экв. Привести примеры.
  3.  Привести примеры  использования  в заданном ИПЯ различных  способов  устранения полисемии и омонимии: развертывание слова до словосочетания и  лексикографический способ.

Задание 2:  Проанализировать проявление многозначности в естественном языке.

Требования к отчету: Итоги выполнения задания представить следующим образом:

  1.  Байка – мягкая ворсистая хлопчато-бумажная ткань.
  2.  Байка – побасенка, выдумка, басня.

ОМОНИМИЯ.

Технология работы:

  1.  Используя справочную литературу (словари, справочники, энциклопедии),  найдите заданное понятие (см. табл.2)  и выпишите его определения.
  2.  Назовите обнаруженное явление: омонимия, полисемия. Объясните причины его возникновения.

Таблица 2

Перечень лексических единиц

Вариант - 1

Вариант –2

Вариант-3

Вариант-4

Знак запятая

Символ

Знак точка

Код

Классификационная система

Схема классификации

Генератор отчетов

Акцептор

Задача

Блок

Команда

Блок-маркер

Генератор

Путь

Показатель

Метка

Аттестат

Ленивец

Бумага

Диверсия

Франк

Фаланга

Струг

Буфет

Задание 3: Осуществить  информационный анализ массива документов с целью выявления ключевых слов.

Требования к отчету: Итоги выполнения задания представить в виде массива карточек, оформленных следующим  образом:

 

Технология работы:

  1.  Проанализировать заданные документы и   выделить ключевые слова.
  2.  Провести лексикографическую обработку лексики, обеспечив стандартизацию записи выделенных  лексических единиц: исчисляемые понятия записываются в форме множественного числа, неисчисляемые – в той форме, в которой принято использовать; если ключевое слово представлено словосочетанием, то оно записывается в инверсированной форме.
  3.  Каждое ключевое слово записать на отдельную карточку с указанием того номера документа, в котором оно присутствует.

Задание 4:  Провести нормализацию лексики.

Технология работы:

  1.  В массиве ключевых слов, полученном в ходе выполнения  задания 3,   выделить слова-синонимы и многозначные слова.
  2.  С помощью отсылок и помет устранить синонимию и многозначность. Например:

Устранение синонимии:  Подчиненный директорий  см. Подкаталог

Устранение многозначности:

                      Технологии библиотечные

                      Технологии информационные

                      Технологии программирования

                            Библиография (деятельность)

                            Библиография (наука)

                            Библиография (указатель литературы)

  1.  Расставить  полученный массив карточек в алфавитном порядке.

Контрольные вопросы

  1.  Каким требованиям должен соответствовать словник ИПЯ?
  2.  Каковы последствия несоблюдения требований однозначности лексических единиц в ИПЯ?
  3.  Установите общие и отличительные признаки таких понятий, как «ключевое слово», «термин», «лексическая единица».

Список рекомендуемой литературы

  1.  Гендина Н.И. Лингвистическое обеспечение автоматизированных библиотечных систем. – Алма-Ата: Гылым, 1991. – С. 64-77.
  2.  Гендина Н.И., Скипор И.Л. Лингвистические основы информатики: Гипертекстовый учебный терминологический словарь-справочник. – Кемерово: Кузбассвузиздат, 2002.-124 с.


 

А также другие работы, которые могут Вас заинтересовать

4576. Создание программы для рисования кривых второго порядка в среде Borland C++ Builder 6 437 KB
  Введение В рамках данного курсового проекта требуется написать программу, рисующую кривые второго порядка. Для разработки была использована среда разработки BorlandC++ Builder 6. Формулировка поставленной задачи Написать программу, рисующую кр...
4577. Покрывающее дерево. Концепция алгоритма Краскала 252.41 KB
  Алгоритм Краскала может строить дерево одновременно для нескольких компонент связности, которые в процессе решения объединяются в одно связанное дерево. Полный граф задается списком ребер. Перед работой список ребер сортируется по возрастанию длины....
4578. Философия человека 185 KB
  Философия человека Понятие философской антропологии. Проблема человека в истории философии. Проблема определения сущности человека. Философские проблемы антропосоциогенеза. Смысл и ценность жизни человека. Введение. С развитием общества ...
4579. Визначення максимальної енергії бета-частинок у спектрі 78 KB
  Визначення максимальної енергіїбета-частинок у спектрі Мета роботи: визначення максимальної енергії бета-частинок в спектрі. Короткі теоретичні відомості Бета-розпад — це самовільний процес, в якому нестабільне ядро перетворюєтьс...
4580. Вивчення прискорення вільного падіння тіла за допомогою фізичного маятника 103 KB
  Вивчення прискорення вільного падіння тіла за допомогою фізичного маятника Мета роботи. Вивчити вільні незатухаючі коливання фізичного маятника і визначити прискорення вільного падіння. Теоретичні відомості. Коливання - це процес, який п...
4581. Управление затратами предприятия на примере ООО «Кормилец» 184.81 KB
  Дать характеристику и классификацию издержек обращения в торговых предприятиях; изучить методы управления затратами; дать характеристику деятельности ООО «Кормилец»; сделать анализ финансового состояния предприятия; разработать план мероприятия по управлению затратами; дать оценку эффективности данных мероприятий...
4582. Сучасні технології захисту інформації в комп’ютерних системах і мережах 2.15 MB
  Частина друга присвячена питанням захисту інформації в комп’ютерних мережах. До її складу входять роботи: Перехоплення мережевого обміну, Сканування TCP/IP мереж, Засоби аналізу захищеності, Міжмережеві екрани, Системи виявлення атак. Лаборатор...
4583. Використання методу Монте-Карло для вирішення стохастичних і детермінованих задач 80 KB
  Використання методу Монте-Карло для вирішення стохастичних і детермінованих задач. Мета роботи:Ознайомитись з методом статистичних випробувань (метод Монте-Карло), та його застосуванням для вирішення стохастичних та детермінованих задач. Метод...
4584. Знайомство з системою комп’ютерної математики - математичною матричною лабораторією MATLAB 232.5 KB
  Знайомство з системою комп’ютерної математики - математичною матричною лабораторією MATLAB. Мета роботи: Ознайомитися з основними елементами і складовими частинами системи комп’ютерної математики MatLab® і її робочим і програмним середовищ...