23597

Синтаксический анализ

Доклад

Иностранные языки, филология и лингвистика

При использовании синтаксического анализа происходит интерпретация отдельных частей высказывания а не всего высказывания в целом. Деревья анализа и свободноконтекстные грамматики. Большинство способов синтаксического анализа реализовано в виде деревьев. Свободноконтекстная грамматика широко используется в машинных языках и с ее помощью созданы высокоэффективные методы анализа.

Русский

2013-08-05

184 KB

1 чел.

Синтаксический анализ. При использовании синтаксического анализа происходит интерпретация отдельных частей высказывания, а не всего высказывания в целом. Обычно сначала производится полный синтаксический анализ, а затем строится внутренне представление введенного текста, либо производится интерпретация.

Деревья анализа и свободно-контекстные грамматики. Большинство способов синтаксического анализа реализовано в виде деревьев. Одна из простейших разновидностей - свободно-контекстная грамматика, состоящая из правил типа S=NP+VP или VP=V+NP и полагающая, что левая часть правила может быть заменена на правую без учета контекста. Свободно-контекстная грамматика широко используется в машинных языках, и с ее помощью созданы высокоэффективные методы анализа. Недостаток этого метода - отсутствие запрета на грамматически неправильные фразы, где, например, подлежащее не согласовано со сказуемым в числе. Для решения этой проблемы необходимо наличие двух отдельных, параллельно работающих грамматик: одной - для единственного, другой - для множественного числа. Кроме того, необходима своя грамматика для пассивных предложений и т.д. Семантически неправильное предложение может породить огромное количество вариантов разбора, из которых один будет превращен в семантическую запись. Всё это делает количество правил огромным и, в свою очередь, свободно-контекстные грамматики непригодными для NLP.

Трансформационная грамматика. Трансформационная грамматика была создана с учетом упомянутых выше недостатков и более рационального использования правил ЕЯ, но оказалась непригодной для NLP. Трансформационная грамматика создавалась Хомским как порождающая, что, следовательно, делало очень затруднительным обратное действие, т.е. анализ.

Расширенная сеть переходов. Расширенная сеть переходов была разработана Бобровым (Bobrow), Фрейзером (Fraser) и во многом Вудсом (Woods) как продолжение идей синтаксического анализа и свободно-контекстных грамматик в частности. Она представляет собой узлы и направленные стрелки, “расширенные” (т.е. дополненные) рядом тестов (правил), на основании которых выбирается путь для дальнейшего анализа. Промежуточные результаты записываются в ячейки (регистры). Ниже приводится пример такой сети, позволяющей анализировать простые предложения всех типов (включая пассив), состоящие из подлежащего, сказуемого и прямого дополнения, таких, как The rabbit nibbles the carrot (Кролик грызет морковь). Обозначения у стрелок означают номер теста, а также либо признаки, аналогичные применяемым в свободно-контекстных грамматиках (NP), либо конкретные слова (by). Тесты написаны на языке LISP и представляют собой правила типа если условие=истина, то присвоить анализируемому слову признак Х и записать его в соответствующую ячейку.

Разберем алгоритм работы сети на вышеприведенном примере. Анализ начинается слева, т. е. с первого слова в предложении. Словосочетание the rabbit проходит тест, который выясняет, что оно не является вспомогательным глаголом (Aux, стрелка 1), но является именной группой (NP, стрелка 2). Поэтому the rabbit кладется в ячейку Subj, и предложение получает признак TypeDeclarative, т.е. повествовательное, и система переходит ко второму узлу. Здесь дополнительный тест не требуется, поскольку он отсутствует в списке тестов, записанных на LISP. Следовательно, слово, стоящее после the rabbit - т. е. nibbles - глагол-сказуемое (обозначение V на стрелке), и nibbles записывается в ячейку с именем V. Перечеркнутый узел означает, что в нем анализ предложения может в принципе закончиться. Но в нашем примере имеется еще и дополнение the carrot, так что анализ продолжается по стрелке 6 (выбор между стрелками 5 и 6 осуществляется снова с помощью специального теста), и словосочетание the carrot кладется в ячейку с именем Obj. На этом анализ заканчивается (последний узел был бы использован в случае анализа такого пассивного предложения, как The carrot was nibbled by the rabbit). Таким образом, в результате заполнены регистры (ячейки) Subj, Type, V и Obj, используя которые, можно получить какое-либо представление (например, дерево).

Расширенная сеть переходов имеет свои недостатки:

немодульность;

сложность при модификации, вызывающая непредвиденные побочные эффекты;

хрупкость (когда единственная неграмматичность в предложении делает невозможным дальнейший правильный анализ);

неэффективность при переборе с возвратами, т.к. ошибки на промежуточных стадиях анализа не сохраняются;

неэффективность с точки зрения смысла, когда с помощью полученного синтаксического представления оказывается невозможным создать правильное семантическое представление.


 

А также другие работы, которые могут Вас заинтересовать

42518. Определение индуктивности катушки разборного трансформатора 79 KB
  Оборудование: разборной школьный трансформатор реостат вольтметры постоянного и переменного тока миллиамперметр источники постоянного и переменного тока. Краткие теоретические сведения Если в проводнике меняется сила тока то в нём возникает ЭДС самоиндукции препятствующая этому изменению пропорциональная скорости изменения силы тока...
42519. Изучение переходных процессов при замыкании и размыкании цепи с индуктивностью 136 KB
  Цель работы: изучить явление электромагнитной индукции и самоиндукции; приобрести навыки наблюдения на экране осциллографа зависимости токов замыкания и размыкания от времени при различных индуктивностях; определить индуктивность катушки графическим методом. Оборудование: осциллограф ИО-4, реле РСМ, катушка индуктивности с сердечником; два резистора, трансформатор 220/8 В, источник постоянного тока.
42520. Определение коэффициента взаимоиндукции двух катушек 67.5 KB
  Оборудование: мост переменного тока магазин индуктивности источник переменного тока. Краткие теоретические сведения Если в проводнике изменяется сила тока то в нём возникает ЭДС самоиндукции 22. Если подключить такую катушку в цепь переменного тока то вследствие периодического изменения силы тока возникает ЭДС самоиндукции препятствующая приложенному напряжению.
42521. Снятие кривой намагничения и петли гистерезиса с помощью осциллографа 142.5 KB
  Краткие теоретические сведения Ферромагнетикам свойственно явление гистерезиса. Замкнутая кривая bcdef называется петлёй гистерезиса рис. Можно получить семейство петель гистерезиса по способу описанному ранее не доводя намагничение образца до насыщения.
42522. Определение ёмкости конденсаторов 104 KB
  Оборудование: регулятор напряжения ЛАТР миллиамперметр переменного тока на 250 мА вольтметр на 150 В конденсаторы. Если конденсатор включить в цепь постоянного тока то спустя некоторое время он зарядится т. Если конденсатор включить в цепь переменного тока то он будет перезаряжаться с частотой переменного ток и в подводящих проводах всё время будут перемещаться электрические заряды т.
42523. Изучение процессов зарядки и разрядки конденсаторов 240.5 KB
  Цель работы: изучить процессы, происходящие в цепи при зарядке (разрядке) конденсаторов, освоить метод расчёта ёмкости конденсаторов по данным о временной зависимости тока зарядки (разрядки). Оборудование: конденсатор, набор резисторов, микроамперметр на 100 мкА, источник питания постоянного тока, выключатель, секундомер, соединительные провода.
42524. Определение горизонтальной составляющей индукции земного магнетизма с помощью тангенс-гальванометра 102 KB
  Южный полюс магнитного поля Земли находится вблизи северных берегов Америки около 750 северной широты и 1010 западной долготы а северный полюс − в Антарктиде около 670 южной широты и 1400 восточной долготы. Существование магнитного поля Земли непосредственно подтверждается отклонением лёгкой магнитной стрелки при её свободном подвесе. При этом последняя устанавливается в направлении касательной к линии индукции магнитного поля Земли.
42525. Изучение однофазного трансформатора 118 KB
  Принцип действия трансформатора основан на использовании явления электромагнитной индукции. Знак − указывает на то что ЭДС в первичной и вторичной обмотках трансформатора противоположены по фазе. Создаваемый этим током магнитный поток Ф0 концентрируется в магнитопроводе и пронизывает все обмотки трансформатора индуцируя в первичной обмотке ЭДС самоиндукции 27.
42526. Определение длины электромагнитной волны в двухпроводной линии 96 KB
  Исследование электромагнитных волн в пространстве связано с некоторыми экспериментальными трудностями поэтому Лехером была предложена система состоящая из двухпроводной линии источника и приёмника электромагнитных волн. В двухпроводной линии реализуются два различных процесса передачи электромагнитного поля: с помощью токов проводимости и с помощью токов смещения. В этом случае электрические явления существенно зависят от сопротивления линии и следовательно от материала проводников.