40067

Создание лексико-семантической основы ИПЯ. Часть 1. Отбор и нормализация лексики

Лабораторная работа

Информатика, кибернетика и программирование

Требования к отчету: Итоги выполнения задания представить в виде таблицы 1 Таблица 1 Способы достижения однозначности лексических единиц в ИПЯ Наименование ИПЯ Наименование элемента организационной структуры Устранение синонимии Устранение многозначности 1. Выявить все использованные в заданном ИПЯ ссылки для устранения синонимии: см. Привести примеры использования в заданном ИПЯ различных способов устранения полисемии и омонимии: развертывание слова до словосочетания и лексикографический способ.

Русский

2013-10-15

49 KB

9 чел.

Лабораторная работа 4

4 часа

Создание лексико-семантической основы ИПЯ. Часть 1. Отбор и нормализация лексики

Цель работы: Познакомиться с методами отбора и нормализации  лексических единиц.

Задачи работы: 1. Овладеть методикой выделения ключевых слов в текстах;

                            2. Изучить способы  устранения синонимии, полисемии,

                                омонимии;

                            3. Приобрести навыки нормализации лексики.

Обеспечивающие средства: тексты первичных и вторичных документов; карточки для записи ключевых слов; справочные издания; информационно-поисковые языки (УДК, ББК, ГРНТИ).

Задание 1:  Выявить способы достижения  однозначности лексических единиц в информационно-поисковых языках.

Требования к отчету: Итоги выполнения задания представить в виде таблицы 1

         Таблица 1

Способы достижения  однозначности лексических единиц в ИПЯ

Наименование ИПЯ

Наименование элемента организационной структуры

Устранение синонимии

Устранение многозначности

1. УДК

АПУ

Морские огурцы см. Голутории

Дерево см. также Древесина

Рыболовство

  •  (лесное хозяйство)
  •  (сельское хозяйство)
  •  (спорт)

Основные таблицы

004.71 Сетевая аппаратура

  621.39 Телекоммуни-кационное оборудование

        004.355.085.22 Накопители на оптических компакт-дисках (CD-ROM)

659.2 Система информации. Справки (реклама)

Технология работы:

  1.  Проанализировать основные таблицы и АПУ к таблицам УДК, ББК, ГРНТИ.
  2.  Выявить все использованные в заданном ИПЯ ссылки для устранения синонимии: см., см. также, экв. Привести примеры.
  3.  Привести примеры  использования  в заданном ИПЯ различных  способов  устранения полисемии и омонимии: развертывание слова до словосочетания и  лексикографический способ.

Задание 2:  Проанализировать проявление многозначности в естественном языке.

Требования к отчету: Итоги выполнения задания представить следующим образом:

  1.  Байка – мягкая ворсистая хлопчато-бумажная ткань.
  2.  Байка – побасенка, выдумка, басня.

ОМОНИМИЯ.

Технология работы:

  1.  Используя справочную литературу (словари, справочники, энциклопедии),  найдите заданное понятие (см. табл.2)  и выпишите его определения.
  2.  Назовите обнаруженное явление: омонимия, полисемия. Объясните причины его возникновения.

Таблица 2

Перечень лексических единиц

Вариант - 1

Вариант –2

Вариант-3

Вариант-4

Знак запятая

Символ

Знак точка

Код

Классификационная система

Схема классификации

Генератор отчетов

Акцептор

Задача

Блок

Команда

Блок-маркер

Генератор

Путь

Показатель

Метка

Аттестат

Ленивец

Бумага

Диверсия

Франк

Фаланга

Струг

Буфет

Задание 3: Осуществить  информационный анализ массива документов с целью выявления ключевых слов.

Требования к отчету: Итоги выполнения задания представить в виде массива карточек, оформленных следующим  образом:

 

Технология работы:

  1.  Проанализировать заданные документы и   выделить ключевые слова.
  2.  Провести лексикографическую обработку лексики, обеспечив стандартизацию записи выделенных  лексических единиц: исчисляемые понятия записываются в форме множественного числа, неисчисляемые – в той форме, в которой принято использовать; если ключевое слово представлено словосочетанием, то оно записывается в инверсированной форме.
  3.  Каждое ключевое слово записать на отдельную карточку с указанием того номера документа, в котором оно присутствует.

Задание 4:  Провести нормализацию лексики.

Технология работы:

  1.  В массиве ключевых слов, полученном в ходе выполнения  задания 3,   выделить слова-синонимы и многозначные слова.
  2.  С помощью отсылок и помет устранить синонимию и многозначность. Например:

Устранение синонимии:  Подчиненный директорий  см. Подкаталог

Устранение многозначности:

                      Технологии библиотечные

                      Технологии информационные

                      Технологии программирования

                            Библиография (деятельность)

                            Библиография (наука)

                            Библиография (указатель литературы)

  1.  Расставить  полученный массив карточек в алфавитном порядке.

Контрольные вопросы

  1.  Каким требованиям должен соответствовать словник ИПЯ?
  2.  Каковы последствия несоблюдения требований однозначности лексических единиц в ИПЯ?
  3.  Установите общие и отличительные признаки таких понятий, как «ключевое слово», «термин», «лексическая единица».

Список рекомендуемой литературы

  1.  Гендина Н.И. Лингвистическое обеспечение автоматизированных библиотечных систем. – Алма-Ата: Гылым, 1991. – С. 64-77.
  2.  Гендина Н.И., Скипор И.Л. Лингвистические основы информатики: Гипертекстовый учебный терминологический словарь-справочник. – Кемерово: Кузбассвузиздат, 2002.-124 с.


 

А также другие работы, которые могут Вас заинтересовать

5400. Метод проецирования 216.5 KB
  Метод проецирования 1.1. Центральное проецирование Центральное проецирование является наиболее общим случаем получения проекций геометрических фигур. В основу построения любого изображения положена операция проецирования, которая заключается в следу...
5401. Философия: функции, этапы развития и современные подходы 96.5 KB
  Философия: функции, этапы развития и современные подходы. Вопрос 1 Типы мировоззрения, вопросы и периоды развития философии. Ценность любой философии, в конечном счёте, измеряется её способностью превратиться в живую популярную философию (А. Швейцер...
5402. Введение в управление качеством 99.5 KB
  Введение в управление качеством Качество как экономическая категория и объект управления Современные предприятия определяют качество как неотъемлемый, важный компонент, обеспечивающий конкурентоспособность и долгосрочное существование предприяти...
5403. Этический и коммуникативный аспект культуры речи 253.5 KB
  Этический и коммуникативный аспект культуры речи План 1. Общая характеристика коммуникативных и этических норм. Их взаимодействие 2. Этические и коммуникативные нормы в рамках коммуникативной ситуации 3. Речевой этикет 4. Коммуникативные качества ре...
5404. Генетика бактерий и вирусов 46.5 KB
  Генетика бактерий и вирусов. Молекулярная биология, изучающая фундаментальные основы жизни, является в значительной степени детищем микробиологии. В качестве основных объектов изучения в ней используют вирусы и бактерии, а основное направление- моле...
5405. Классификация теплового оборудования предприятий общепита 63.5 KB
  Классификация теплового оборудования предприятий общепита Тепловое оборудование предприятий общественного питания можно классифицировать следующим образом: 1) по организационно-техническому признаку 2) по функциональному или технологическому назнач...
5406. Введение в патологическую анатомию (патологию) 35 KB
  Введение в патологическую анатомию (патологию) В истории развития пат. Анатомии выделют 4 периода: Анатомический (с древности до начала 19 века) Микроскопический (с первой трети 19 века до 50х годов 20 века) Ультрамикроскопиеский (...
5407. Основы Windows. Копирование. Буфер обмена Программы Проводник и Мой компьютер 73 KB
  Основы Windows. Копирование. Буфер обмена Программы Проводник и Мой компьютер Корзина. Поиск файлов и папок 1.Выделение группы объектов 2.Определение объема памяти дисков, размера копируемых объектов 1.Копирование с помощью Буф...
5408. Введение в Microsoft NET 143 KB
  Введение в Microsoft .NET Любому современному программисту, который желает идти в ногу с последними веяниями, каждые несколько лет приходится переучиваться. Языки (C++, VisualBasic, Java), библиотеки (MFC, ATL, STL), архитектуры (COM, CORBA), ...