40067

Создание лексико-семантической основы ИПЯ. Часть 1. Отбор и нормализация лексики

Лабораторная работа

Информатика, кибернетика и программирование

Требования к отчету: Итоги выполнения задания представить в виде таблицы 1 Таблица 1 Способы достижения однозначности лексических единиц в ИПЯ Наименование ИПЯ Наименование элемента организационной структуры Устранение синонимии Устранение многозначности 1. Выявить все использованные в заданном ИПЯ ссылки для устранения синонимии: см. Привести примеры использования в заданном ИПЯ различных способов устранения полисемии и омонимии: развертывание слова до словосочетания и лексикографический способ.

Русский

2013-10-15

49 KB

12 чел.

Лабораторная работа 4

4 часа

Создание лексико-семантической основы ИПЯ. Часть 1. Отбор и нормализация лексики

Цель работы: Познакомиться с методами отбора и нормализации  лексических единиц.

Задачи работы: 1. Овладеть методикой выделения ключевых слов в текстах;

                            2. Изучить способы  устранения синонимии, полисемии,

                                омонимии;

                            3. Приобрести навыки нормализации лексики.

Обеспечивающие средства: тексты первичных и вторичных документов; карточки для записи ключевых слов; справочные издания; информационно-поисковые языки (УДК, ББК, ГРНТИ).

Задание 1:  Выявить способы достижения  однозначности лексических единиц в информационно-поисковых языках.

Требования к отчету: Итоги выполнения задания представить в виде таблицы 1

         Таблица 1

Способы достижения  однозначности лексических единиц в ИПЯ

Наименование ИПЯ

Наименование элемента организационной структуры

Устранение синонимии

Устранение многозначности

1. УДК

АПУ

Морские огурцы см. Голутории

Дерево см. также Древесина

Рыболовство

  •  (лесное хозяйство)
  •  (сельское хозяйство)
  •  (спорт)

Основные таблицы

004.71 Сетевая аппаратура

  621.39 Телекоммуни-кационное оборудование

        004.355.085.22 Накопители на оптических компакт-дисках (CD-ROM)

659.2 Система информации. Справки (реклама)

Технология работы:

  1.  Проанализировать основные таблицы и АПУ к таблицам УДК, ББК, ГРНТИ.
  2.  Выявить все использованные в заданном ИПЯ ссылки для устранения синонимии: см., см. также, экв. Привести примеры.
  3.  Привести примеры  использования  в заданном ИПЯ различных  способов  устранения полисемии и омонимии: развертывание слова до словосочетания и  лексикографический способ.

Задание 2:  Проанализировать проявление многозначности в естественном языке.

Требования к отчету: Итоги выполнения задания представить следующим образом:

  1.  Байка – мягкая ворсистая хлопчато-бумажная ткань.
  2.  Байка – побасенка, выдумка, басня.

ОМОНИМИЯ.

Технология работы:

  1.  Используя справочную литературу (словари, справочники, энциклопедии),  найдите заданное понятие (см. табл.2)  и выпишите его определения.
  2.  Назовите обнаруженное явление: омонимия, полисемия. Объясните причины его возникновения.

Таблица 2

Перечень лексических единиц

Вариант - 1

Вариант –2

Вариант-3

Вариант-4

Знак запятая

Символ

Знак точка

Код

Классификационная система

Схема классификации

Генератор отчетов

Акцептор

Задача

Блок

Команда

Блок-маркер

Генератор

Путь

Показатель

Метка

Аттестат

Ленивец

Бумага

Диверсия

Франк

Фаланга

Струг

Буфет

Задание 3: Осуществить  информационный анализ массива документов с целью выявления ключевых слов.

Требования к отчету: Итоги выполнения задания представить в виде массива карточек, оформленных следующим  образом:

 

Технология работы:

  1.  Проанализировать заданные документы и   выделить ключевые слова.
  2.  Провести лексикографическую обработку лексики, обеспечив стандартизацию записи выделенных  лексических единиц: исчисляемые понятия записываются в форме множественного числа, неисчисляемые – в той форме, в которой принято использовать; если ключевое слово представлено словосочетанием, то оно записывается в инверсированной форме.
  3.  Каждое ключевое слово записать на отдельную карточку с указанием того номера документа, в котором оно присутствует.

Задание 4:  Провести нормализацию лексики.

Технология работы:

  1.  В массиве ключевых слов, полученном в ходе выполнения  задания 3,   выделить слова-синонимы и многозначные слова.
  2.  С помощью отсылок и помет устранить синонимию и многозначность. Например:

Устранение синонимии:  Подчиненный директорий  см. Подкаталог

Устранение многозначности:

                      Технологии библиотечные

                      Технологии информационные

                      Технологии программирования

                            Библиография (деятельность)

                            Библиография (наука)

                            Библиография (указатель литературы)

  1.  Расставить  полученный массив карточек в алфавитном порядке.

Контрольные вопросы

  1.  Каким требованиям должен соответствовать словник ИПЯ?
  2.  Каковы последствия несоблюдения требований однозначности лексических единиц в ИПЯ?
  3.  Установите общие и отличительные признаки таких понятий, как «ключевое слово», «термин», «лексическая единица».

Список рекомендуемой литературы

  1.  Гендина Н.И. Лингвистическое обеспечение автоматизированных библиотечных систем. – Алма-Ата: Гылым, 1991. – С. 64-77.
  2.  Гендина Н.И., Скипор И.Л. Лингвистические основы информатики: Гипертекстовый учебный терминологический словарь-справочник. – Кемерово: Кузбассвузиздат, 2002.-124 с.


 

А также другие работы, которые могут Вас заинтересовать

31149. Как образуется массовое сознание 21 KB
  Фазы формирования МС: 1Фаза появления МС переживание реальное или мнимое событие явление кот отражается в сознании индивида и рассматривается им как значимое событие в его жизни; 2фаза действия эмоций между эмоциями и действиями нет сознательной регуляции; 3фаза рационализации внести логику в прошедшие события объяснить необъяснимое сформировать правила поведения в данной ситуации; 4выражение потребность чека делиться впечатлениями потребность в общении.
31150. Какова структура массового сознания 20.5 KB
  Структура массового сознания три уровня перевернутый треугольник 1Ядро МС Когнитивное бессознательное нижний выражается в эмоциях чувствах спонтанных действиях инстинктивном поведении. Здесь появляются стереотипы 3Уровень выражения массового сознания верхний общественное мнение обществ настроение.
31151. Что такое архетип 21 KB
  Механизм действий А: Архетипы широко используются в коммерческой деятти. Люди работающие в области СО рекламы и маркетинга знают чтобы сообщение произвело впечатление на ЦА нужно чтобы в этом сообщении имел место опред архетип. Потому что чек лучше воспринимает то сообщение в кот заложен наиболее близкий ему архетип.
31152. Каковы свойства архетипов 20 KB
  Свойства: 1 Универсальность А свойственны каждому чеку; 2 Культурная обусловленность А; 3 Устойчивость.
31153. Что такое стереотип 20 KB
  Стереотип- устойчивое представление о каких-л. объектах, свойствах той или иной соц. группы. (пример: свои – чужие. Чужие – любые другие, не входящие в твою группу)
31154. Каковы свойства стереотипа 20 KB
  Пример: свои чужие. Чужие любые другие не входящие в твою группу Свойства С: Стереотипы неиндивидуальны это групповое явление.
31155. Что такое слухи и как они связаны с феноменом массы 21.5 KB
  Свойства слухов: 1Высокая степень обобщенности; 2привязка ко времени и среде своего возникновения. 3наличие свежей новости; 4неофициальность; 5Слух сохраняет свою связь со всеми перечисленными типами соц сообщений; 6однократная воспроизводимость Второй раз одному и тому же лицу слух не пересказывается; 7подвергается дальнейшей трансляции. Слушающий впоследствии становясь говорящим передает этот слух новому слушающему.
31156. Каковы информационные предпосылки распространения слухов 23 KB
  Наиболее активными распространителями слухов явл люди формальная деятть кот играет в организации далеко не первую роль но кот хотят показать свою значимость и влияние.Чувство солидарности кот выражается в стремлении помочь коллегам друзьям знакомым предупредить их и дать возможность самим или совместно подготовиться к встрече с неприятным событием.Побуждение других к поддержке себя и своей позиции подталкивание к групповым действиям кот распространитель слуха не решается совершить сам в одиночку.
31157. Каковы психологические предпосылки распространения слухов 21.5 KB
  Чувство солидарности человека распространяющего слух.Слух как стремление человека найти союзников.Личная неприязнь злоба на определенного человека. Такой мотив побуждает человека распространять негативные слухи о своем недруге .