23597

Синтаксический анализ

Доклад

Иностранные языки, филология и лингвистика

При использовании синтаксического анализа происходит интерпретация отдельных частей высказывания а не всего высказывания в целом. Деревья анализа и свободноконтекстные грамматики. Большинство способов синтаксического анализа реализовано в виде деревьев. Свободноконтекстная грамматика широко используется в машинных языках и с ее помощью созданы высокоэффективные методы анализа.

Русский

2013-08-05

184 KB

1 чел.

Синтаксический анализ. При использовании синтаксического анализа происходит интерпретация отдельных частей высказывания, а не всего высказывания в целом. Обычно сначала производится полный синтаксический анализ, а затем строится внутренне представление введенного текста, либо производится интерпретация.

Деревья анализа и свободно-контекстные грамматики. Большинство способов синтаксического анализа реализовано в виде деревьев. Одна из простейших разновидностей - свободно-контекстная грамматика, состоящая из правил типа S=NP+VP или VP=V+NP и полагающая, что левая часть правила может быть заменена на правую без учета контекста. Свободно-контекстная грамматика широко используется в машинных языках, и с ее помощью созданы высокоэффективные методы анализа. Недостаток этого метода - отсутствие запрета на грамматически неправильные фразы, где, например, подлежащее не согласовано со сказуемым в числе. Для решения этой проблемы необходимо наличие двух отдельных, параллельно работающих грамматик: одной - для единственного, другой - для множественного числа. Кроме того, необходима своя грамматика для пассивных предложений и т.д. Семантически неправильное предложение может породить огромное количество вариантов разбора, из которых один будет превращен в семантическую запись. Всё это делает количество правил огромным и, в свою очередь, свободно-контекстные грамматики непригодными для NLP.

Трансформационная грамматика. Трансформационная грамматика была создана с учетом упомянутых выше недостатков и более рационального использования правил ЕЯ, но оказалась непригодной для NLP. Трансформационная грамматика создавалась Хомским как порождающая, что, следовательно, делало очень затруднительным обратное действие, т.е. анализ.

Расширенная сеть переходов. Расширенная сеть переходов была разработана Бобровым (Bobrow), Фрейзером (Fraser) и во многом Вудсом (Woods) как продолжение идей синтаксического анализа и свободно-контекстных грамматик в частности. Она представляет собой узлы и направленные стрелки, “расширенные” (т.е. дополненные) рядом тестов (правил), на основании которых выбирается путь для дальнейшего анализа. Промежуточные результаты записываются в ячейки (регистры). Ниже приводится пример такой сети, позволяющей анализировать простые предложения всех типов (включая пассив), состоящие из подлежащего, сказуемого и прямого дополнения, таких, как The rabbit nibbles the carrot (Кролик грызет морковь). Обозначения у стрелок означают номер теста, а также либо признаки, аналогичные применяемым в свободно-контекстных грамматиках (NP), либо конкретные слова (by). Тесты написаны на языке LISP и представляют собой правила типа если условие=истина, то присвоить анализируемому слову признак Х и записать его в соответствующую ячейку.

Разберем алгоритм работы сети на вышеприведенном примере. Анализ начинается слева, т. е. с первого слова в предложении. Словосочетание the rabbit проходит тест, который выясняет, что оно не является вспомогательным глаголом (Aux, стрелка 1), но является именной группой (NP, стрелка 2). Поэтому the rabbit кладется в ячейку Subj, и предложение получает признак TypeDeclarative, т.е. повествовательное, и система переходит ко второму узлу. Здесь дополнительный тест не требуется, поскольку он отсутствует в списке тестов, записанных на LISP. Следовательно, слово, стоящее после the rabbit - т. е. nibbles - глагол-сказуемое (обозначение V на стрелке), и nibbles записывается в ячейку с именем V. Перечеркнутый узел означает, что в нем анализ предложения может в принципе закончиться. Но в нашем примере имеется еще и дополнение the carrot, так что анализ продолжается по стрелке 6 (выбор между стрелками 5 и 6 осуществляется снова с помощью специального теста), и словосочетание the carrot кладется в ячейку с именем Obj. На этом анализ заканчивается (последний узел был бы использован в случае анализа такого пассивного предложения, как The carrot was nibbled by the rabbit). Таким образом, в результате заполнены регистры (ячейки) Subj, Type, V и Obj, используя которые, можно получить какое-либо представление (например, дерево).

Расширенная сеть переходов имеет свои недостатки:

немодульность;

сложность при модификации, вызывающая непредвиденные побочные эффекты;

хрупкость (когда единственная неграмматичность в предложении делает невозможным дальнейший правильный анализ);

неэффективность при переборе с возвратами, т.к. ошибки на промежуточных стадиях анализа не сохраняются;

неэффективность с точки зрения смысла, когда с помощью полученного синтаксического представления оказывается невозможным создать правильное семантическое представление.


 

А также другие работы, которые могут Вас заинтересовать

53995. The Best Place for Holidays 81.5 KB
  Today at the lesson we’ll speak about the best place for holidays, listen to the dialogue about visiting Malta, revise and identify the past tenses, put the verbs in brackets into the correct tense, read Vicky’s letter about her holidays in Madrid, in groups write the letter to a pen friend according to the plan, get to know if you “can taste the flower seeds”.
53996. Modern Inventions. The Internet 68 KB
  Communication in social networks was chosen as the object of our lesson because communication has always been an important part of young people's lives. Today they can choose between traditional and new ways of communication. Traditionally the young meet after classes with their school friends, make parties and go to the movies or disco clubs to have fun, relax and acquire new friends.
53997. CLOTHES ACCORDING TO THE SEASON 189 KB
  Now children, listen to me and guess: what season it is. 1. It often rains. The leaves are falling. They are red and brown. 2. It is hot and sunny. There are many flowers. They are red, yellow, pink and white. 3. It is warm. There are small green leaves on the trees. The birds are singing.
53998. Our Fafourite Holidays 81.5 KB
  Today we’re going to discuss very pleasant and interesting things. We’ll speak about holidays. We do love holidays, don’t we? By the end of the lesson you should be able to actively use the target vocabulary in your talk about some holidays’ celebrations.
53999. It Often Rains 58.5 KB
  Express your opinion in a chain. Mind the colour of your card. If you’ve got a green card you tell us about good points of the rainy weather; if your card is red you tell us about bad points of it.
54000. Science and Inventions “Scientists and their Contributions to the World Science” 134 KB
  Glad to hear that. The more so because I am going to give you some food for thought. As at the previous lessons we spoke about science and how it is important in our life, I think it won`t be difficult for you to understand and explain the meaning of the following words which were once said by a famous writer B.Shaw...
54001. Sports. Plural (irregular nouns) 223.5 KB
  On February we’ll have the world sport competitions which called the Olympic Games. There are winter and summer Olympic Games. The last summer Olympic Games were in Perkin in China. The next winter Olympic Games will take part in Vancouver in Canada. The team of our country will take part in these competitions.
54002. What’s the weather like? 148 KB
  Today we are going to speak about the weather, about your favourite seasons. You know, the weather is a safe topic for a conversation. That's why we should be good at it.
54003. Я сохраняю энергию 836.52 KB
  At the end of the lessons students are evaluated and given the hometask to create a group outcome project to be considered by school authority for further long-term implementment and for further its presentation as promotion of eco-consciousness among pupils of the gymnasium.