23597

Синтаксический анализ

Доклад

Иностранные языки, филология и лингвистика

При использовании синтаксического анализа происходит интерпретация отдельных частей высказывания а не всего высказывания в целом. Деревья анализа и свободноконтекстные грамматики. Большинство способов синтаксического анализа реализовано в виде деревьев. Свободноконтекстная грамматика широко используется в машинных языках и с ее помощью созданы высокоэффективные методы анализа.

Русский

2013-08-05

184 KB

1 чел.

Синтаксический анализ. При использовании синтаксического анализа происходит интерпретация отдельных частей высказывания, а не всего высказывания в целом. Обычно сначала производится полный синтаксический анализ, а затем строится внутренне представление введенного текста, либо производится интерпретация.

Деревья анализа и свободно-контекстные грамматики. Большинство способов синтаксического анализа реализовано в виде деревьев. Одна из простейших разновидностей - свободно-контекстная грамматика, состоящая из правил типа S=NP+VP или VP=V+NP и полагающая, что левая часть правила может быть заменена на правую без учета контекста. Свободно-контекстная грамматика широко используется в машинных языках, и с ее помощью созданы высокоэффективные методы анализа. Недостаток этого метода - отсутствие запрета на грамматически неправильные фразы, где, например, подлежащее не согласовано со сказуемым в числе. Для решения этой проблемы необходимо наличие двух отдельных, параллельно работающих грамматик: одной - для единственного, другой - для множественного числа. Кроме того, необходима своя грамматика для пассивных предложений и т.д. Семантически неправильное предложение может породить огромное количество вариантов разбора, из которых один будет превращен в семантическую запись. Всё это делает количество правил огромным и, в свою очередь, свободно-контекстные грамматики непригодными для NLP.

Трансформационная грамматика. Трансформационная грамматика была создана с учетом упомянутых выше недостатков и более рационального использования правил ЕЯ, но оказалась непригодной для NLP. Трансформационная грамматика создавалась Хомским как порождающая, что, следовательно, делало очень затруднительным обратное действие, т.е. анализ.

Расширенная сеть переходов. Расширенная сеть переходов была разработана Бобровым (Bobrow), Фрейзером (Fraser) и во многом Вудсом (Woods) как продолжение идей синтаксического анализа и свободно-контекстных грамматик в частности. Она представляет собой узлы и направленные стрелки, “расширенные” (т.е. дополненные) рядом тестов (правил), на основании которых выбирается путь для дальнейшего анализа. Промежуточные результаты записываются в ячейки (регистры). Ниже приводится пример такой сети, позволяющей анализировать простые предложения всех типов (включая пассив), состоящие из подлежащего, сказуемого и прямого дополнения, таких, как The rabbit nibbles the carrot (Кролик грызет морковь). Обозначения у стрелок означают номер теста, а также либо признаки, аналогичные применяемым в свободно-контекстных грамматиках (NP), либо конкретные слова (by). Тесты написаны на языке LISP и представляют собой правила типа если условие=истина, то присвоить анализируемому слову признак Х и записать его в соответствующую ячейку.

Разберем алгоритм работы сети на вышеприведенном примере. Анализ начинается слева, т. е. с первого слова в предложении. Словосочетание the rabbit проходит тест, который выясняет, что оно не является вспомогательным глаголом (Aux, стрелка 1), но является именной группой (NP, стрелка 2). Поэтому the rabbit кладется в ячейку Subj, и предложение получает признак TypeDeclarative, т.е. повествовательное, и система переходит ко второму узлу. Здесь дополнительный тест не требуется, поскольку он отсутствует в списке тестов, записанных на LISP. Следовательно, слово, стоящее после the rabbit - т. е. nibbles - глагол-сказуемое (обозначение V на стрелке), и nibbles записывается в ячейку с именем V. Перечеркнутый узел означает, что в нем анализ предложения может в принципе закончиться. Но в нашем примере имеется еще и дополнение the carrot, так что анализ продолжается по стрелке 6 (выбор между стрелками 5 и 6 осуществляется снова с помощью специального теста), и словосочетание the carrot кладется в ячейку с именем Obj. На этом анализ заканчивается (последний узел был бы использован в случае анализа такого пассивного предложения, как The carrot was nibbled by the rabbit). Таким образом, в результате заполнены регистры (ячейки) Subj, Type, V и Obj, используя которые, можно получить какое-либо представление (например, дерево).

Расширенная сеть переходов имеет свои недостатки:

немодульность;

сложность при модификации, вызывающая непредвиденные побочные эффекты;

хрупкость (когда единственная неграмматичность в предложении делает невозможным дальнейший правильный анализ);

неэффективность при переборе с возвратами, т.к. ошибки на промежуточных стадиях анализа не сохраняются;

неэффективность с точки зрения смысла, когда с помощью полученного синтаксического представления оказывается невозможным создать правильное семантическое представление.


 

А также другие работы, которые могут Вас заинтересовать

37259. Многозадачная операционная система MS Windows 1.09 MB
  Особенности операционной системы Windows : Многозадачность одновременное выполнение нескольких программ; Многооконный графический интерфейс все работы выполняються на рабочем столе где расположены различные обьекты для работы и инструменты работы: кнопки меню; Оптимизирована для работы на 32разрядном процессоре; Обмен данными между различными программами Windows; Эффективная работа с памятью; Использование длинных имен файлов; Автоматическая настройка различных внешних устройств; Является ОС для одноранговой локальной...
37260. Базы данных БД (СУБД Microsoft Access 9Х) 4.37 MB
  БАЗА ДАННЫХ это единое централизованное хранилище данных определенной предметной области под предметной областью здесь понимается например школа предприятие районо и др. Каждая программа имеет доступ к конкретным данным базы данных с помощью специальных программ которые получили название системы управления базами данных СУБД. Примерами баз данных являются: библиотечные каталоги записная книжка классные журналы журналы учета имущества галантерейной базы и др.
37261. Программа TOTAL COMMANDER 1.14 MB
  Файловый менеджер Totl Commnder предоставляет еще один способ работы с файлами и папками в среде Windows. Программа в простой и наглядной форме обеспечивает выполнение таких операций с файловой системой как переход из одного каталога в другой создание переименование копирование перенос поиск просмотр и удаление файлов и каталогов а также многое другое. не устанавливается на компьютер вместе с установкой самой Windows как например программа для работы с файловой системой Проводник или стандартные программы Блокнот Калькулятор и т.
37262. Креслення засобами прогарми AutoCAD 229.5 KB
  Також можна набрати з клавіатури: line У відповідь система видасть: Specify first point: Вводимо координати першої точки: 1010. Далі вводяться координати наступних точок: Specify next point or [Undo]:30.20 Specify next point or [Undo]:35.50 Для завершення побудови можна тиснути клавішу ENTER або скористатися ключами с close чи u undo: Specify next point or[Close Undo]:close Тут ключ close автоматично замикає проведені сегменти ключ undo відміняє проведення останнього сегмента.
37263. Микросхема ПЗУ и система BIOS 46.5 KB
  Комплект программ находящихся в ПЗУ образует базовую систему вводавывода BIOS Bsic Input Output System. Программы входящие в BIOS позволяют нам наблюдать на экране диагностические сообщения сопровождающие запуск компьютера а также вмешиваться в ход запуска с помощью клавиатуры. BIOS в общем случае представляет собой набор правил определяющих как происходит конфигурирование компонент компьютера при его включении как его устройства взаимодействуют друг с другом как осуществляется простейший ввод вывод данных.
37264. Гуманітарна підготовка в ЗС України 125 KB
  Розкрити роботу щодо організації гуманітарної підготовки в частинах та підрозділах ЗС України. Проаналізувати основні вимоги порядок підготовки і проведення занять з гуманітарної підготовки . Основна частина 70 Заслуховування доповіді 10 Обговорення відпрацювання першого питання: Організація гуманітарної підготовки в частинах та підрозділах ЗС України. 30 Обговорення відпрацювання другого питання: Основні вимоги порядок підготовки і проведення занять з гуманітарної підготовки 30 3.
37265. Техніка комунікабельності офіцера 172.5 KB
  Оголосити тему заняття, її актуальність та зв'язок з іншими темами, мету та навчальні питання, які будуть розглянуті. Особливу увагу на занятті необхідно звернути на те, що існує об'єктивна потреба в оволодінні всім офіцерським складом загальними поняттями про психологію спілкування у військовому колективі, а також розкрити сутність, функції та структура спілкування
37266. Методика виховного впливу на військовослужбовців в арміях НАТО 153 KB
  Заняття №20: Методика виховного впливу на військовослужбовців в арміях НАТО. Основна частина 70 Обговорення питання №1 âФорми методи і техніки виховання військовослужбовців в арміях провідних країн світу â 35 Обговорення питання №2 â Аналіз відео інформаційних матеріалів з мережі Інтернет щодо вирішення офіцерами проблемних питань щодо виховання підлеглих в арміях провідних країн світу â 35 3. Головною метою його роботи є оптимізація спільної військової діяльності міжособистісних взаємин а також моральнопсихологічного стану...
37267. Осветительные приборы автомобиля на основе светодиодов 3.83 MB
  Можно утверждать, что ни один из известных вариантов исполнения приборов системы освещения не решает всего комплекса проблем внешних осветительных приборов транспортных средств, при относительно невысокой стоимости изделий этого класса.