23597

Синтаксический анализ

Доклад

Иностранные языки, филология и лингвистика

При использовании синтаксического анализа происходит интерпретация отдельных частей высказывания а не всего высказывания в целом. Деревья анализа и свободноконтекстные грамматики. Большинство способов синтаксического анализа реализовано в виде деревьев. Свободноконтекстная грамматика широко используется в машинных языках и с ее помощью созданы высокоэффективные методы анализа.

Русский

2013-08-05

184 KB

1 чел.

Синтаксический анализ. При использовании синтаксического анализа происходит интерпретация отдельных частей высказывания, а не всего высказывания в целом. Обычно сначала производится полный синтаксический анализ, а затем строится внутренне представление введенного текста, либо производится интерпретация.

Деревья анализа и свободно-контекстные грамматики. Большинство способов синтаксического анализа реализовано в виде деревьев. Одна из простейших разновидностей - свободно-контекстная грамматика, состоящая из правил типа S=NP+VP или VP=V+NP и полагающая, что левая часть правила может быть заменена на правую без учета контекста. Свободно-контекстная грамматика широко используется в машинных языках, и с ее помощью созданы высокоэффективные методы анализа. Недостаток этого метода - отсутствие запрета на грамматически неправильные фразы, где, например, подлежащее не согласовано со сказуемым в числе. Для решения этой проблемы необходимо наличие двух отдельных, параллельно работающих грамматик: одной - для единственного, другой - для множественного числа. Кроме того, необходима своя грамматика для пассивных предложений и т.д. Семантически неправильное предложение может породить огромное количество вариантов разбора, из которых один будет превращен в семантическую запись. Всё это делает количество правил огромным и, в свою очередь, свободно-контекстные грамматики непригодными для NLP.

Трансформационная грамматика. Трансформационная грамматика была создана с учетом упомянутых выше недостатков и более рационального использования правил ЕЯ, но оказалась непригодной для NLP. Трансформационная грамматика создавалась Хомским как порождающая, что, следовательно, делало очень затруднительным обратное действие, т.е. анализ.

Расширенная сеть переходов. Расширенная сеть переходов была разработана Бобровым (Bobrow), Фрейзером (Fraser) и во многом Вудсом (Woods) как продолжение идей синтаксического анализа и свободно-контекстных грамматик в частности. Она представляет собой узлы и направленные стрелки, “расширенные” (т.е. дополненные) рядом тестов (правил), на основании которых выбирается путь для дальнейшего анализа. Промежуточные результаты записываются в ячейки (регистры). Ниже приводится пример такой сети, позволяющей анализировать простые предложения всех типов (включая пассив), состоящие из подлежащего, сказуемого и прямого дополнения, таких, как The rabbit nibbles the carrot (Кролик грызет морковь). Обозначения у стрелок означают номер теста, а также либо признаки, аналогичные применяемым в свободно-контекстных грамматиках (NP), либо конкретные слова (by). Тесты написаны на языке LISP и представляют собой правила типа если условие=истина, то присвоить анализируемому слову признак Х и записать его в соответствующую ячейку.

Разберем алгоритм работы сети на вышеприведенном примере. Анализ начинается слева, т. е. с первого слова в предложении. Словосочетание the rabbit проходит тест, который выясняет, что оно не является вспомогательным глаголом (Aux, стрелка 1), но является именной группой (NP, стрелка 2). Поэтому the rabbit кладется в ячейку Subj, и предложение получает признак TypeDeclarative, т.е. повествовательное, и система переходит ко второму узлу. Здесь дополнительный тест не требуется, поскольку он отсутствует в списке тестов, записанных на LISP. Следовательно, слово, стоящее после the rabbit - т. е. nibbles - глагол-сказуемое (обозначение V на стрелке), и nibbles записывается в ячейку с именем V. Перечеркнутый узел означает, что в нем анализ предложения может в принципе закончиться. Но в нашем примере имеется еще и дополнение the carrot, так что анализ продолжается по стрелке 6 (выбор между стрелками 5 и 6 осуществляется снова с помощью специального теста), и словосочетание the carrot кладется в ячейку с именем Obj. На этом анализ заканчивается (последний узел был бы использован в случае анализа такого пассивного предложения, как The carrot was nibbled by the rabbit). Таким образом, в результате заполнены регистры (ячейки) Subj, Type, V и Obj, используя которые, можно получить какое-либо представление (например, дерево).

Расширенная сеть переходов имеет свои недостатки:

немодульность;

сложность при модификации, вызывающая непредвиденные побочные эффекты;

хрупкость (когда единственная неграмматичность в предложении делает невозможным дальнейший правильный анализ);

неэффективность при переборе с возвратами, т.к. ошибки на промежуточных стадиях анализа не сохраняются;

неэффективность с точки зрения смысла, когда с помощью полученного синтаксического представления оказывается невозможным создать правильное семантическое представление.


 

А также другие работы, которые могут Вас заинтересовать

25234. К. Леві-Строс Структурна антропологія 33.5 KB
  полягає в застосуванні структурного методу до аналізу історикоетнографічних процесів культури як окремого людського буття так і етногенезу в цілому а також до становлення окремих форм соціального буття. полягає в тому щоб в процесі аналізу конкретної етнографічної проблематики наблизитися до осягнення проблеми становлення і формування людського суспільства і людської культури. З огляду на це вивчення життя первісних народів є ключем для розуміння загальних закономірностей культури. Енґельса оскільки момент якісного стрибка від...
25235. Поняття історичних законів у новоєвропейській філософії історії 25 KB
  Поняття історичних законів у новоєвропейській філософії історії. Поняття історичної закономірності у новоєвропейській філософії співіснує із поняттям прогресу.Час дух осягає себе в поняттях. Яскравої конкретизації поняття історичної закономірності набуває в марксизмі.
25236. Поняття системи у філософії науки 27 KB
  Поняття системи розкривається в двох основних значеннях онтологічному та методологічному. В методології широко використовується поняття теоретичної системи знання яке описує встановлення єдності між різними елементами знання на основі певних семантичних та синтаксичних правил. Онтологічний зміст поняття система розкривається в формі опису складно існуючої реальності яку поділяють на елементи звязки між ними і характеризують як цілісне утвореня. Специфічне тлумачення поняття система набуває в рамках діалектики та синергетики де вона...
25237. Проблема міфології у філософській спадщині Лосєва 41 KB
  Проблема міфології у філософській спадщині Лосєва Олексій Лосєв 1893 1988 представник російської філософії її €œзолотого віку€. Головні праці: €œФілософія імені€ €œМузика як предмет логіки€ €œДіалектика міфу€ €œІсторія античної естетики€. Міфологічна проблематика займає центральне місце в філософській спадщіні Лосєва. Сам себе він називава філософом міфу оскільки всі його роботи в тій чи іншій мірі спроба відкрити світ міфу для читатача.
25238. Проблеми єдності онтології та гносеології 23 KB
  Критика марксизму виявила неприйнятність в межах філософського осмислення буття науки тези Леніна про єдність онтології та гносеології оскільки людина як субєкт без їх відокремлення нездатна встановлювати осмислене відношення до буття на основі методів. Онтологія дає нам знання про буття а гносеологія про пізнання цього буття. Кожній частині буття відповідає своє адекватне пізнання. Постмодерний дискурс критикуючи раціонально зцентровану гносеологію виявляє ірраціональні елементи як онтологічні ознаки людського буття.
25239. Життєвий світ і система 32 KB
  Габермас досліджує шлях уречевлення комунікації визначаючи його як роз'єднання системи і життєвого світу. Концепція життєвого світу дістає своє емпіричне втілення за Габермасом в архаїчних суспільствах де структури нормативної інтеграції опосередковані мовленнєвою комунікацією водночас становлять системні структури. Тому архаїчне родове суспільство Габермас розглядає як втілення єдності системи й життєвого світу. Однак ця система зберігає своє відношення хоча й перетворене до життєвого світу.
25240. Життєвий світ та система 22 KB
  Поняття життєвого світу повязане з горизонтом. Розрізняють внутрішній та зовнішній горизонти. Внутрішній горизонт це сукупність припущень якими ми керуємося в сприйнятті та розумінні речей. Зовнішній горизонт це сукупність речей через яку ми сприймаємо річ.
25241. Філософія “критичного раціоналізму” К.Поп пера 25.5 KB
  логічна теорія наукового методу є теорією дедуктивного методу перевірки згідно з якою гіпотезу можна перевірити тільки емпірично і тільки після того як вона була висунута. Процедура перевірки передбачає що з даної теорії за допомогою інших раніше прийнятих положень виводяться деякі одиничні положення €œпрогнози€ з них вибираються ті положення які не виводяться з попередньо прийнятої теорії і шляхом порівняння їх з результатами практичних застосувань і експериментів виноситься рішення стосовно них. При цьому позитивне рішення може...
25242. Основні концепції історико-філософського процесу 29.5 KB
  Основні концепції історикофілософського процесу. Можна виділити 3 історикофілософські парадигми: негативістську класичнугегелівську та пост класичну. Він будує свою систему як свбоме усвідомлення всього попереднього історикофілософського досвіду. Стрижнем історикофілософського наслідування її внутрішнім механізмом є діалектичне заперечення яке одержує значення найважливішого методологічного принципу аналізу поступального руху філософського знання наступна філософська система не просто відкидає попередню а діалектично заперечує її...