40067

Создание лексико-семантической основы ИПЯ. Часть 1. Отбор и нормализация лексики

Лабораторная работа

Информатика, кибернетика и программирование

Требования к отчету: Итоги выполнения задания представить в виде таблицы 1 Таблица 1 Способы достижения однозначности лексических единиц в ИПЯ Наименование ИПЯ Наименование элемента организационной структуры Устранение синонимии Устранение многозначности 1. Выявить все использованные в заданном ИПЯ ссылки для устранения синонимии: см. Привести примеры использования в заданном ИПЯ различных способов устранения полисемии и омонимии: развертывание слова до словосочетания и лексикографический способ.

Русский

2013-10-15

49 KB

9 чел.

Лабораторная работа 4

4 часа

Создание лексико-семантической основы ИПЯ. Часть 1. Отбор и нормализация лексики

Цель работы: Познакомиться с методами отбора и нормализации  лексических единиц.

Задачи работы: 1. Овладеть методикой выделения ключевых слов в текстах;

                            2. Изучить способы  устранения синонимии, полисемии,

                                омонимии;

                            3. Приобрести навыки нормализации лексики.

Обеспечивающие средства: тексты первичных и вторичных документов; карточки для записи ключевых слов; справочные издания; информационно-поисковые языки (УДК, ББК, ГРНТИ).

Задание 1:  Выявить способы достижения  однозначности лексических единиц в информационно-поисковых языках.

Требования к отчету: Итоги выполнения задания представить в виде таблицы 1

         Таблица 1

Способы достижения  однозначности лексических единиц в ИПЯ

Наименование ИПЯ

Наименование элемента организационной структуры

Устранение синонимии

Устранение многозначности

1. УДК

АПУ

Морские огурцы см. Голутории

Дерево см. также Древесина

Рыболовство

  •  (лесное хозяйство)
  •  (сельское хозяйство)
  •  (спорт)

Основные таблицы

004.71 Сетевая аппаратура

  621.39 Телекоммуни-кационное оборудование

        004.355.085.22 Накопители на оптических компакт-дисках (CD-ROM)

659.2 Система информации. Справки (реклама)

Технология работы:

  1.  Проанализировать основные таблицы и АПУ к таблицам УДК, ББК, ГРНТИ.
  2.  Выявить все использованные в заданном ИПЯ ссылки для устранения синонимии: см., см. также, экв. Привести примеры.
  3.  Привести примеры  использования  в заданном ИПЯ различных  способов  устранения полисемии и омонимии: развертывание слова до словосочетания и  лексикографический способ.

Задание 2:  Проанализировать проявление многозначности в естественном языке.

Требования к отчету: Итоги выполнения задания представить следующим образом:

  1.  Байка – мягкая ворсистая хлопчато-бумажная ткань.
  2.  Байка – побасенка, выдумка, басня.

ОМОНИМИЯ.

Технология работы:

  1.  Используя справочную литературу (словари, справочники, энциклопедии),  найдите заданное понятие (см. табл.2)  и выпишите его определения.
  2.  Назовите обнаруженное явление: омонимия, полисемия. Объясните причины его возникновения.

Таблица 2

Перечень лексических единиц

Вариант - 1

Вариант –2

Вариант-3

Вариант-4

Знак запятая

Символ

Знак точка

Код

Классификационная система

Схема классификации

Генератор отчетов

Акцептор

Задача

Блок

Команда

Блок-маркер

Генератор

Путь

Показатель

Метка

Аттестат

Ленивец

Бумага

Диверсия

Франк

Фаланга

Струг

Буфет

Задание 3: Осуществить  информационный анализ массива документов с целью выявления ключевых слов.

Требования к отчету: Итоги выполнения задания представить в виде массива карточек, оформленных следующим  образом:

 

Технология работы:

  1.  Проанализировать заданные документы и   выделить ключевые слова.
  2.  Провести лексикографическую обработку лексики, обеспечив стандартизацию записи выделенных  лексических единиц: исчисляемые понятия записываются в форме множественного числа, неисчисляемые – в той форме, в которой принято использовать; если ключевое слово представлено словосочетанием, то оно записывается в инверсированной форме.
  3.  Каждое ключевое слово записать на отдельную карточку с указанием того номера документа, в котором оно присутствует.

Задание 4:  Провести нормализацию лексики.

Технология работы:

  1.  В массиве ключевых слов, полученном в ходе выполнения  задания 3,   выделить слова-синонимы и многозначные слова.
  2.  С помощью отсылок и помет устранить синонимию и многозначность. Например:

Устранение синонимии:  Подчиненный директорий  см. Подкаталог

Устранение многозначности:

                      Технологии библиотечные

                      Технологии информационные

                      Технологии программирования

                            Библиография (деятельность)

                            Библиография (наука)

                            Библиография (указатель литературы)

  1.  Расставить  полученный массив карточек в алфавитном порядке.

Контрольные вопросы

  1.  Каким требованиям должен соответствовать словник ИПЯ?
  2.  Каковы последствия несоблюдения требований однозначности лексических единиц в ИПЯ?
  3.  Установите общие и отличительные признаки таких понятий, как «ключевое слово», «термин», «лексическая единица».

Список рекомендуемой литературы

  1.  Гендина Н.И. Лингвистическое обеспечение автоматизированных библиотечных систем. – Алма-Ата: Гылым, 1991. – С. 64-77.
  2.  Гендина Н.И., Скипор И.Л. Лингвистические основы информатики: Гипертекстовый учебный терминологический словарь-справочник. – Кемерово: Кузбассвузиздат, 2002.-124 с.


 

А также другие работы, которые могут Вас заинтересовать

47608. Общие правила исполнения обязанности по уплате налогов и сборов 71.69 KB
  Некоторые авторы предлагают в качестве категории, равнозначной налоговой обязанности, использовать налоговое обязательство. Полагаем, с такой позицией нельзя согласиться. Термин «обязательство» имеет ярко выраженную частноправовую природу и основывается на свободно выраженном волеизъявлении лица тем или иным образом (по своему усмотрению)
47610. ИЗУЧЕНИЕ ЛИЧНОСТИ ШКОЛЬНИКА 1.2 MB
  Программы наблюдения за особенностями направленности характера темперамента школьника. ВВЕДЕНИЕ Настоящие рекомендации предназначены для школьных психологов и студентов пединститута проходящих педагогическую практику в школе и выполняющих задание по изучению личности школьника. Изучение личности школьника следует проводить в естественных условиях.
47611. ИНФОРМАЦИОННЫЕ СИСТЕМЫ В ЭКОНОМИКЕ 3.58 MB
  Хранение и обработка информации в базах данных. Работа с системами управления базами данных ccess.8 Обработка и хранение экономической информации в базах данных 52 4 4 28 16 18 3 Раздел 3.8 Обработка и хранение экономической информации в базах данных 52 2 6 12 20 44 3 Раздел 3.
47612. Сравнительная педагогика: Учебное пособие 1.72 MB
  Проблема демократизации школы. Реформы высшей школы. Экспериментальные школы. В пособии дан сравнительный анализ основных процессов школьного образования и воспитания в современном мире в нем представлены разнообразные материалы о современном состоянии школы и педагогики ведущих стран мира Адресованное студентам средних и высших педагогических учебных заведений пособие может быть полезно также работникам школьных учреждений и ведомств всем кто интересуется развитием образования и воспитания в современном мире.
47613. МЕТОДОЛОГИЯ СТРУКТУРНОГО АНАЛИЗА И ПРОЕКТИРОВАНИЯ SADT 1.17 MB
  Использование экспертных систем, языков четвертого поколения и систем автоматизированного производства постоянно расширяется. Успех этих систем непосредственно зависит от нашей способности предварить их разработку и внедрение описанием всего комплекса проблем...
47615. Организационно-экономическое обоснование научных и технических разработок 481 KB
  Техническое нормирование Расчет количества оборудования и производственных площадей. Организация труда на участке Организация ремонта оборудования. Расчет и составление сметы расходов на содержание и эксплуатацию оборудования. Расчёт количества оборудования и производственных площадей...