23602

Автоматический морфологический анализ. Соотношение словаря и анализа

Доклад

Иностранные языки, филология и лингвистика

Автоматический морфологический анализ. Соотношение словаря и анализа. Автоматический морфологический анализ АМА анализ отдельно взятой словоформы и всех тех сведений которые из нее можно извлечь безотносительно к тому относятся ли эти сведения к морфологии или нет. АМА определяется двумя факторами: 1 тип ЕЯ подвергаемого анализу 2 тип алгоритма авт.

Русский

2013-08-16

12.5 KB

7 чел.

2. Автоматический морфологический анализ.  Соотношение словаря и анализа.

Автоматический морфологический анализ (АМА)- анализ отдельно взятой словоформы и всех тех сведений, которые из нее можно извлечь безотносительно к тому, относятся ли эти сведения к морфологии или нет.

АМА определяется двумя факторами:

1) тип ЕЯ, подвергаемого анализу

2) тип алгоритма авт. обработки текста

МА начинается с поиска входного слова в словаре и с членения словоформы на составляющие ее морфемы.

Общая схема морфологического анализа:

1. Общие правила (управляющий алгоритм

2. Список (таблицы) суффиксов

3. Список (таблицы) информации к суффиксам

4. Список нестандартных операций (нестандартная запись)

5. Обработка омонимичных основ

Важен тип входного словаря. Учитывая  связь МА со словарем можно выделить следующие группы МА:

1. морфологический анализ со словарем словоформ: каждой словоформе приписывается определенная информация (слово отыскивается. информация извлекается)

2. морфологический анализ со словарем основ (проблемы: анализ найденных в словаре форм, как отождествить разные словоформы одного и того же слова)

сравнение словоформы на полное совпадение  -> нет -> словоформа = основа + окончание. В задачу МА входит разрешение синонимии и омонимии основ

3. МА методом логического умножения (Варга)

Каждой морфеме сопоставляется информация, полученная в результате объединения информации о словоформах, в которые входит данная морфема. Информация о словоформе получается как пересечение или логическая конъюнкция (&) информации о морфемах. входящих в данную словоформу.  Тем самым функция. определенная на множестве словоформ. заменяется на функцию, определенную на множестве морфем.  Такой анализ производится при наличии словаря основ и применяется к флективным языкам. каждой букве соответствует булевый вектор (есть 1, нет 0).  перемножая эти векторы выходят на категорию.

4. независимый МА без словаря словоформ.

Максимальное использование информации о флексиях во флективных языках. выделяются грамматические морфемы (флексии, предлоги, союзы, знаки препинания между словами - все элементы. передающие связи слов во фразе.

Группа флексий, характеризующаяся одинаковым набором грамм. отношений. которые они могут передавать, образует морфему.

флексии, входящие в одну морфему, называются алломорфами, т.е. морфемными синонимами.  Задача алгоритма состоит в том, чтобы по взаимному расположению алломорфов отнести каждую флексию к ее морфеме.  С этой целью строятся специальные словари: словари флексий, словари слов, не несущих грамм. инф. (наречий и т.п.).  Способ имеет ограниченной применение.


 

А также другие работы, которые могут Вас заинтересовать

76523. Отбор теоретических понятий при изучении морфологии 29.5 KB
  В школьной практике изучается морфология на синт основе то есть главное внимание уделяется условию и характеру употребления словоформ в разных стилях и жанрах речи формированию умения школьников целесообразно использовать слова разных частей речи в построении связанного высказывания. Все словоформы русского языка систематизированы и объединены в части речи которые в школе рассматриваются с точки зрения структурно семантического принципа значения формы и функции слова. Цели: формирование понятия морф система русского языка обогащение...
76524. Отбор теоретических понятий при изучении синтаксиса 30.5 KB
  ИНТЕРНЕТ Рассмотрение синтаксической единицы – предложения начинается в 1 классе Обеспечить усвоение учащимися знаний о строе русского языка на основе сознательного восприятия ими системы синтаксических понятий и правил ; Разграничение в научном синтаксисе словосочетания и предложения способствовало выделению существенных признаков качественно различных единиц языка более глубокому постижению специфики каждой из них. Синтаксис предложения рассматривает коммуникативную единицу языка служащую средством формирования выражения и сообщения...
76525. Основные теоретические понятия методики обучения стилистике 25.5 KB
  Выделяют пять стилей из них четыре книжных: научный официальноделовой публицистический художественный и разговорный стиль. Научный стиль Научный стиль один из книжных стилей который используется в научных трудах учебниках и учебных пособиях устных выступлениях на научные темы. В научном стиле можно выделить следующие разновидности: 1 собственно научный стиль. 2 научнопопулярный стиль который присущ текстам предназначенным для популяризации научных знаний.
76526. Виды речевых ошибок: методика работы по их предупреждению и исправлению 29 KB
  Употребление слов в несвойственных им значениях. Повторение однокоренных слов в одном предложении тавтология: Писатель ярко описывает события того дня. Речевая недостаточность возникает в случае когда пропущено нужное слово. Употребление лишних слов.
76527. Отбор теоретических понятий при изучении фонетики, графики и орфоэпии 31 KB
  Необходимо при изучении словообразования: буквы имеющие два один звук. Цель изучения:осознаное усвоение звуковой системы языка; знакомство с орфоэпическими нормами СРЛЯ; формирование орфографических навыков.Задачи:Формирование основных фонетических понятий: звук слог ударение интонация;Дать представление о русской графике как науке устанавливающей общие принципы передачи звучащей речи на письме;Развивать фонематический слух учащегося и на этой основе формировать орфографическую грамотность школьника;Закрепить умение обозначить звуки...
76529. Русский язык как предмет изучения. Место русского языка в ряду других учебных предметов. Межпредметные связи на уроках русского языка 34.5 KB
  Место русского языка в ряду других учебных предметов. Межпредметные связи на уроках русского языка.На каждом уровне выделяются след основные линии: система языка или знания о языке сформированные в виде понятий способов действия а также владения самим языком и его нормами. В содержание стандарта случены отдельные сведения которые отсутствуют в современных учебниках но в то же время представляют собой ближайшую перспективу для совершенствования курса родного языка.
76530. Цели и задачи обучения русскому языку. Структура и содержание курса русского языка в средней школе 29.5 KB
  Языковая часть курса в каждой теме представлена тремя компонентами: а сведения о языке подлежащие усвоению; б умения и навыки в области культуры речи языкового анализа практические умения общеучебные умения; в способ деятельности через учебник В структуре школьной программы по русскому языку выделяются два уровня: уровень программы в целом и уровень программы каждого класса. Структура программы в целом делится на органически связанные но самостоятельные программы для каждого класса. Структура программы второго уровня уровня каждого...
76531. Методическая система, содержание ее компонентов 53 KB
  Классификация Текучева основа: использование разных источников знаний: Рассказ или слово учителя; Беседа; Разбор; Наблюдение. Классификация Лидия Прокофьевна Федоренко основа: использование разных источников знаний 3 группы методов обучения. пунктуационный диктант контрольный контроль знаний и обучающие...