23592

Формальные модели синтаксической структуры предложения

Доклад

Иностранные языки, филология и лингвистика

Система составляющих это множество отрезков предложения которое обладает тем свойством что каждые два входящих в него отрезка либо не пересекаются либо один из них содержится в другом. При графическом изображении система составляющих тоже приобретает вид дерева дерева непосредственных составляющих ДНС. грамматика деревьев служит не для порождения предложений а для преобразования деревьев интерпретируемых как деревья подчинения или деревья составляющих например грамматика система правил преобразования деревьев интерпретируемых...

Русский

2013-08-05

19.5 KB

3 чел.

Билет 9

1. Формальные модели синтаксической структуры предложения.

Динамические и статистические модели

1. Дескриптивная модель Задача - описание структуры языка

нормирование (определение всех правил синтаксических структур)

исчисление

1) Грамматика зависимостей (европейская традиция, близка к НС, один из авторов - Гладкий) - указание для каждого слова тех слов, которые ему непосредственно подчинены.

Дерево синтаксических зависимостей  есть дерево, множество узлов которого служит множеством вхождений слов в предложение.  Деревом называется множество, между элементами которого - узлами - установлено бинарное отношение - отношение подчинения и графически изображают стрелками. идущими от подчиняющих узлов к подчиненным,- такое, что:

среди узлов имеется один  - корень - неподчиненный никакому другому узлу

каждый из остальных узлов подчинен точно одному узлу

нельзя, отправившись из к.л. узла вдоль стрелок вернутся в тот же узел.

ДЗ (дерево зависимостей) обычно используется  в описаниях языков со свободным порядком слов (в частности, русского).  Стрелки ДЗ обычно помечаются символами синтаксических отношений (предикативное, определительное и т.п.).

2) Метод НС  составляющие - Для описания синтаксической структуры предложения выделяются группы слов, функционирующие как отдельные синт. единицы - составляющие.

Система  составляющих - это множество отрезков предложения которое обладает тем свойством, что каждые два входящих в него отрезка либо не пересекаются либо один из них содержится в другом.

Одна из НС - ядро конструкции, остальные - маргинальные элементы.

При графическом изображении система составляющих тоже приобретает вид дерева (дерева непосредственных составляющих - ДНС).

ДНС используются преим. в описаниях языков с жестким порядком слов.

Составляющие обычно помечаются символами грамм. категорий (именная группа, группа переходного глагола и т.п.)

2. Трансформационная грамматика (Харрис, 50-е гг.) (грамматика деревьев) служит не для порождения предложений, а для преобразования деревьев, интерпретируемых как деревья подчинения или деревья составляющих, например грамматика - система правил преобразования деревьев, интерпретируемых как "чистые" деревья  подчинения предложений (без линейного порядка слов).

три уровня описания

1) правила НС

2) трансформационные правила

3) морфологические правила

Допущения:

синт. система может быть разбита на ряд подсистем, одна из которых - исходная (ядерная), остальные - производные. Ядерная Т - набор предложений (утвердительных, простых, с глаголом в изъяв. форме, активного залога, наст. времени.)

ядерное предложение описывает элементарные ситуации, а класс ЯП - все множество элем. ситуаций.

любой сложный синт. тип можно получить при применении упорядоченного набора обязательных и факультативных трансформаций к ядерному предложению.

Представление синт. структуры предложения - указание ядерного типа, лежащего в основе предложения и трансформаций, которые к нему применялись, а также их последовательности.

Метод явился основой порождающей грамматики Хомского.

3. Порождающая грамматика Хомского, представляющая собой упорядоченную систему  Г =(V,W,П,R), где V и W - непересекающиеся конечные множества - основное (терминальное) и вспомогательное (нетерминальное), П - элемент W, называемый начальным символом и R - конечное множество правил вида       , где      цепочки (конечные последовательности) из основных и вспомогательных символов.  Множество тех цепочек из основных символов, которые выводимы в Г из ее начального символа, называют языком, порождаемым грамматикой Г и обозначают L(Г).  Если все правила Г имеют вид           , где            - правый и левый контексты, то Г называется грамматикой  составляющих или грамматикой непосредственно составляющих (ГНС). Чаще всего основные символы интерпретируются как слова, вспомогательные - как символы грамматических категорий, начальный символ - как символ категории "предложение".

4. Реляционная модель

5. Аппликационная модель (Шаумяна?)

Доминационная грамматика, которая порождает множество цепочек, интерпретируемых обычно как предложения и вместе с их синтакс. структурами в виде ДЗ.

Грамматики Монтегю служат одновременно для описания синтакс. и семант. структуры предложения.  В них используется сложный математико-логический аппарат  (так называемая интенциональная логика).

2. Экспертные системы и их архитектура.  Функции основных компонентов.

Экспертная система - это компьютерная программа, которая моделирует рассуждение человека-эксперта в определенной области, используя для этого БЗ, содержащую факты и правила об этой области и некоторую процедуру логического вывода.  

Разработка ЭС - сравнительно новое направление в системах ИИ; второе название - инженерия знаний (термин ввел в 1977 Фегенбаум), сформировалась в середине 70 гг.

Раньше была цепочка: аналитик - программист - оператор - пользователь; теперь пользователь может обращаться прямо к ЭВМ (либо только через инженера по знаниям).

Структура ЭС:

раньше:

входные данные

программ

теперь:

входные данные

интерпретатор БЗ

БЗ

Обычные программы имеют фиксированную последовательность шагов, строго определенную программистом, ЭС пользуются нахождением удовлетворительного решения методом проб и ошибок.

ЭС решают трудно формализуемые задачи. не имеющие алгоритмического решения () медицина, геология, управление, юридические науки).

Попов: три причины появления ЭС:

ориентированы на решение задач в неформализованных областях

предназначены для пользователей, не имеющих спец. навыков программирования

ЭС решают задачи лучше, чем человек.

3 принципа разработки ЭС:

1. мощность ЭС определяется мощностью БЗ и процедурами ее пополнения, т.о. компонент приобретения знаний важнее компонента логического вывода. (Раньше большее внимание уделялось лог. выводу).

2. Знание. используемое ЭС, является в основном эвристическим, экспериментальным, поэтому используется коэффициент достоверности.

3. ЭС реализуется в форме диалоговой системы.

ЭС должна обладать способностью приобретать знания.

2 источника приобретения знаний:

1) от эксперта

2) из текстов (не разработано)

ЭС решают практические задачи. а не экспериментальные; решения ЭС могут быть объяснены пользователю, т.е обладают свойством прозрачности, для этого существует специальный компонент - объяснительный.

Формальная основа ЭС: базовое понятие - правило продукции или формальные процедуры системы: правила вида условие -> действие если -> то  (если была разлита горючая жидкостью то вызовите пожарных).

Термин продукция ввел Пост (1943)

Свойство продукции - всякая формальная система. оперирующая символами, может быть реализована одной из продукционных систем.

Архитектура ЭС

Пользователь ЭС

Общение на ЕЯ

Лигвитсический компонент анализа с синтеза входных сообщений

рабочая память

текущее состояние проведения экспертизы

объяснительный компонент

интерпретатор

компонент приобретения знаний

БЗ

 БЗ имеет динамический характер, содержит факты и правила в форме продукций

 интерпретатор (решатель) имеет дело с процедурами логического вывода, на основе имеющихся данных решает задачу

 лингвистический процессор осуществляет диалог с пользователем

рабочая память хранит данные

 компонент приобретения знаний - с его помощью знания извлекаются из эксперта или текста и заносятся в БЗ

объяснительный компонент отвечает на вопрос, почему принято данное решение и чем мотивирован выбор.

2 режима работы ЭС:

 приобретение знаний: участвует эксперт и инженер по знаниям (посредник)ручные и автоматизированные методы (brainstorm)

 режим решения задач: главный участник - пользователь, заинтересованный в результате.

Типы ЭС:

демонстрационные прототипы (56)

исследовательские (92)

действующие (12)

промышленные (4)

коммерческие (9)

Примеры ЭС

две старейшие ЭС:

DENDRAL (химическая тематика, определяет структуру хим. элементов)

MAXIMA (решение мат. задач)

Система FOBS 

Санджай, Чадна и др., "Использование известных ситуаций (cases) для построения" ЭС MEDIA (выбор оптимального СМИ для маркетинга на материале Harvard Business School) на основе оболочки ADVISOR. Система задает вопросы и анализирует все факторы, связанные с продуктом (поведение покупателя, ориентация на конкретного покупателя, конъюнктура), рекомендует средство рекламы, перечисляет возможные альтернативы и аргументирует свой выбор.


 

А также другие работы, которые могут Вас заинтересовать

65135. НАХОДКИ МЕДНЫХ МОНЕТ С ОБОЗНАЧЕНИЕМ МОНЕТНОГО ДВОРА «ШЕХР АЛ-ДЖЕДИД» НА УКРАИНЕЕ 32.5 KB
  Именно локализация находок таких монет в свое время позволили С.Яниной правильно локализовать местоположение золотоордынского города имевшего намонетах название как: ал Махруса Янги Шехрили ал Махруса Шехр ал Джедид.
65138. Монеты и денежное обращение в Монгольских государствах XIII-ХV веках 121 KB
  Некоторое время назад среди случайных находок сделанных в Южной Украине Крыму и Кубани стали встречаться джучидские монеты достаточно необычного оформления. Путем прорисовок по трем экземплярам...
65139. МОНЕТЫ СОЛХАТА 239.5 KB
  На протяжении длительного времени (со второй половины ХIII века и до распада Золотой Орды в ХV веке) город Крым являлся административным и торговым центром крымского наместничества. Согласно нумизматическим данным город...
65140. НОВГОРОД-СЕВЕРСКАЯ МОНЕТА ДМИТРИЯ ОЛЬГЕРДОВИЧА 76 KB
  Одна из монет клада автором публикации была отнесена к раннему типу монет Владимира Ольгердовича. Это определение было принято литовскими нумизматами а единственный экземпляр этой монеты издан как первый тип монеты...
65141. Новое в изучении Новгород-северских подражаний джучидским дирхемам третей четверти XIV века 104.5 KB
  Целью настоящей работы является поиск критериев надежного определения монет – подражаний денгам Мухаммеда Буляка (чекан Орды 772,773 и 777 годы хиджры), чеканенных на территории Новгород-Северского княжества в 1370-1380-е годы.
65142. НОВЫЙ ТИП СЕРЕБРЯНЫХ МОНЕТ УЗБЕКА, ЧЕКАНЕННЫХ В БУЛГАРЕ 53.5 KB
  Хромов 25 октября 2001 года Обрабатывая анонимные и анэпиграфные монеты 13 века из Волжско-Булгарского региона мной было обнаружено две серебряные монеты дирхемы неопубликованного ранее типа.
65143. О монетной чеканке на территории Киевского княжества в 50-е годы XIV века («киевские» подражания монетам Джанибека) 154 KB
  астоящий доклад является доработанным вариантом авторского доклада на XII Всероссийской нумизматической конференции. Более подробная разбивка типов монет на варианты стала возможным благодаря новым находкам публикуемых монет. Цифра в скобках указывает на порядковый номер монеты в весовой шкале для варианта, поэтому с добавлением новых монет до выхода их полного Каталога может изменяться