23602

Автоматический морфологический анализ. Соотношение словаря и анализа

Доклад

Иностранные языки, филология и лингвистика

Автоматический морфологический анализ. Соотношение словаря и анализа. Автоматический морфологический анализ АМА анализ отдельно взятой словоформы и всех тех сведений которые из нее можно извлечь безотносительно к тому относятся ли эти сведения к морфологии или нет. АМА определяется двумя факторами: 1 тип ЕЯ подвергаемого анализу 2 тип алгоритма авт.

Русский

2013-08-16

12.5 KB

9 чел.

2. Автоматический морфологический анализ.  Соотношение словаря и анализа.

Автоматический морфологический анализ (АМА)- анализ отдельно взятой словоформы и всех тех сведений, которые из нее можно извлечь безотносительно к тому, относятся ли эти сведения к морфологии или нет.

АМА определяется двумя факторами:

1) тип ЕЯ, подвергаемого анализу

2) тип алгоритма авт. обработки текста

МА начинается с поиска входного слова в словаре и с членения словоформы на составляющие ее морфемы.

Общая схема морфологического анализа:

1. Общие правила (управляющий алгоритм

2. Список (таблицы) суффиксов

3. Список (таблицы) информации к суффиксам

4. Список нестандартных операций (нестандартная запись)

5. Обработка омонимичных основ

Важен тип входного словаря. Учитывая  связь МА со словарем можно выделить следующие группы МА:

1. морфологический анализ со словарем словоформ: каждой словоформе приписывается определенная информация (слово отыскивается. информация извлекается)

2. морфологический анализ со словарем основ (проблемы: анализ найденных в словаре форм, как отождествить разные словоформы одного и того же слова)

сравнение словоформы на полное совпадение  -> нет -> словоформа = основа + окончание. В задачу МА входит разрешение синонимии и омонимии основ

3. МА методом логического умножения (Варга)

Каждой морфеме сопоставляется информация, полученная в результате объединения информации о словоформах, в которые входит данная морфема. Информация о словоформе получается как пересечение или логическая конъюнкция (&) информации о морфемах. входящих в данную словоформу.  Тем самым функция. определенная на множестве словоформ. заменяется на функцию, определенную на множестве морфем.  Такой анализ производится при наличии словаря основ и применяется к флективным языкам. каждой букве соответствует булевый вектор (есть 1, нет 0).  перемножая эти векторы выходят на категорию.

4. независимый МА без словаря словоформ.

Максимальное использование информации о флексиях во флективных языках. выделяются грамматические морфемы (флексии, предлоги, союзы, знаки препинания между словами - все элементы. передающие связи слов во фразе.

Группа флексий, характеризующаяся одинаковым набором грамм. отношений. которые они могут передавать, образует морфему.

флексии, входящие в одну морфему, называются алломорфами, т.е. морфемными синонимами.  Задача алгоритма состоит в том, чтобы по взаимному расположению алломорфов отнести каждую флексию к ее морфеме.  С этой целью строятся специальные словари: словари флексий, словари слов, не несущих грамм. инф. (наречий и т.п.).  Способ имеет ограниченной применение.


 

А также другие работы, которые могут Вас заинтересовать

12416. Изучение термоэлектронной эмиссии и определение работы выхода электронов из металла 181.5 KB
  Отчет. К лабораторной работе 6.4. Изучение термоэлектронной эмиссии и определение работы выхода электронов из металла. Цель работы: Вычисление работы выхода вольфрама различными методами а так же проверка закона БогуславскогоЛенгмюра. Приборы и инстр...
12417. Определение термического коэффициента сопротивления и ширины запретной зоны полупроводника 100 KB
  Отчет. К лабораторной работе 6.6. Определение термического коэффициента сопротивления и ширины запретной зоны полупроводника. Цель работы: Определить ширину запретной зоны полупроводника и коэффициенты β для полупроводника и металла. Приборы и инструменты ...
12418. Изучение внешнего фотоэффекта, лабораторная работа 267.5 KB
  Отчет. К лабораторной работе 6.12. Изучение внешнего фотоэффекта. Цель работы: изучить внешний фотоэффект. Приборы и инструменты № Название Предел измерения Цена деления Аб...
12419. Интеллектуальные информационные системы 339.5 KB
  Методические указания к лабораторным работам и семинарским занятиям по дисциплине Интеллектуальные информационные системы Содержание Методические указания к лабораторным работам 3 Лабораторная работа №1. Семантические сети 4 Последовательность в...
12420. Исследование явления интерференции света при помощи бипризмы Френеля 309.5 KB
  Отчет. К лабораторной работе 7.1. Исследование явления интерференции света при помощи бипризмы Френеля. Цель работы: Определение длины световой волны. Приборы и инструменты № Название Пр
12421. Исследование явления интерференции света при помощи колец Ньютона 69 KB
  Отчет. К лабораторной работе 7.2. Исследование явления интерференции света при помощи колец Ньютона. Цель работы: Определение радиуса линзы при помощи колец Ньютона. Приборы и инструменты № Название ...
12422. Определение концентрации водного раствора сахара с помощью поляриметра 347 KB
  Отчет. К лабораторной работе 7.4. Определение концентрации водного раствора сахара с помощью поляриметра. Цель работы: Ознакомиться с явлением поляризации света и его применением на примере измерения концентрации раствора сахара Используя раствор с известно...
12423. Изучение явления дисперсии и исследование зависимости показателя преломления от длины волны света 100.5 KB
  Отчет. К лабораторной работе 7.5. Изучение явления дисперсии и исследование зависимости показателя преломления от длины волны света. Цель работы: Изучить явление дисперсии и исследовать зависимость показателя преломления от длины волны света Приборы и...
12424. Определение показателя преломления и средней дисперсии жидкостей и твердых тел с помощью рефрактометра Аббе 409.5 KB
  Отчет. К лабораторной работе 7.6. Определение показателя преломления и средней дисперсии жидкостей и твердых тел с помощью рефрактометра Аббе. Цель работы: Исследование зависимости показателя преломления раствора от концентрации. Приборы и инструмент