23599

Автоматизация анализа письменного текста: основные подходы к решению проблемы

Доклад

Иностранные языки, филология и лингвистика

ТБД автоматизированная система инвентаризации и машинного представления терминологической лексики и ее семантизации в системах машинного и человекомашинного речевого общения. Научные задачи: моделирование терминологической системы РЯ как системы подсистем построение общенаучных и общетеоретических тезаурусов исследование русской терминологии Типы традиционного использования ТБД: справочноинформационное обслуживание специалистов различных областей знания обеспечение традиционного перевода научнотехнической литературы обеспечение АСОТ...

Русский

2013-08-05

16 KB

1 чел.

Билет 14

1. Автоматизация анализа письменного текста: основные подходы к решению проблемы.

Существует 2 основные стратегии решения проблемы:

1. модульный подход - последовательный анализ по уровням (морфологический, синтаксический, семантический, прагматический)

2. интегральный подход (более современный и более адекватный, Р. Шенк)

1.   Системы модульного типа (Леонтьева):

модуль морфологического анализа

-> полное морф. представление

модуль синтаксического анализа

-> полное синт.представление

модуль семантического анализа

-> частичное (фрагментарное) представл.

прагматический анализ

(пока не реализован)

Для широких ПО может быть использован в нескольких системах:

СМП (SYSTRAN)

системах извлечения знаний

ИПС

2.   Системы интегрального типа

Концептуальный анализ

->

фрагментарные концептуальные представления:

морф.анализ

синт.анализ

сем. анализ

сценарии, фреймы. планы.

Ищет в тексте диагностические слова

заполняет пустые слоты в сценарии

делает ряд концептуальных выводов (inferences) о смысле текста (в результате чего способна отвечать на поставленные вопросы по содержанию)

на определенных этапах подключает процедуры

нельзя получить уровневое представление

тексты узко ограниченной тематики

Пример: интегральная система анализа Шенка:

1. MARGE (Memory Response Generation in English) - обработка концептуальной информации.  В основе лежит теория концептуальных зависимостей - комплексная теория человеческого мышления.

Работает в двух режимах:

перефразирование (перевод входной фразы на ЯКЗ)

концептуальный вывод

2. Модель SAM (Script Applying Mechanism) является компьютерной программой, которая позволяет понимать связность текста за счет применения сценариев:

 POLITICS (ведет диалог, моделирует политическую идеологию)

 PAM  -> TALE-SPIN - порождение сказок

 FRUMP - машинное реферирование сообщений на нескольких языках, чтение , опирающееся на понятие интереса (Integral Partial Parser)

2. Терминологические банки данных: структуры, функции, методы построения.

ТБД - автоматизированная система инвентаризации и машинного представления терминологической лексики и ее семантизации в системах машинного и человеко-машинного речевого общения. Это единая служба с удобным доступом, описывающая все сведения о термине и ликвидирующая неравномерность описания терминологии.

Научные задачи:

моделирование терминологической системы РЯ как системы подсистем

построение общенаучных и общетеоретических тезаурусов

исследование русской терминологии

Типы традиционного использования ТБД:

справочно-информационное обслуживание специалистов различных областей знания

обеспечение традиционного перевода научно-технической литературы

обеспечение АСОТ, включая системы машинного перевода

лингвистическое обеспечение авт. систем информации

обеспечение работ по упорядочению терминологии

подготовка и издание терминологических словарей

унификация определенных терминов

подготовка научных отчетов о составе РЯ

Организационная структура ТБД:

терминологические центры

службы переводов (переводческая функция)

службы стандартизации (нормативная функция)

университеты (исследовательская функция)

всероссийские органы НТИ (по АСУ и ИПС)

Функциональная структура ТБД:

1. Головной ТБД - справочно-поисковый аппарат  по видовым банкам данных:

ведение коммуникативного формата данных

организация и руководство работами по передаче данных в ТБД

обработка и ввод данных

обслуживание предприятий

2. Специализированные ТБД (сбор, хранение , обработка информации), могут включать существующие ТБД, словарно-терминологические службы НТИ:

отбор представительного массива источников

ввод и обновление терминологической информации в БД

передача информации другим СТБД и ГТБД

эксплуатация СТБД в соответствии с конкретными задачами организации.

ТБД состоит из ряда массивов, которые называются подфондами.

Подфонды - массивы терминов, которые создаются и хранятся в центральном органе МФРЯ (Машинный фонд РЯ) на базе массивов первичного типа.

Подфонды:

специальных и межотраслевых терминов, фигурирующих в отдельных отраслях знаний и деятельности

общенаучных и общетехнических терминов

терминоэлементов (используются в нескольких терминосистемах).

3. Примеры оформления сложных документов (сноски, газетная верстка, колонтитулы и т. д) в MS Word 5.0.

Сноски:

1. курсор на месте символа ссылки на сноску

2. Format, Footnote

3. в поле reference mark ввести ссылку на сноску (не более 28 символов)

4. enter

5. ввести текст сноски (до нескольких абзацев)

перемещение между сноской и текстом: Jump Footnote

использование окна сносок: Esc W S F

переход из окна в окно: F1

местоположение сносок:

по умолчанию - на той же стр., где ссылка

 Format Division Layout: same page, end

Газетная верстка:

колонки:

1. Options: Show Layout Yes или Alt-F4

2. Esc Format Division Layout

колонтитулы:

1. курсор в начало документа

2. ввести текст + enter

3. курсор внутрь текста или выделить текст

4. Esc Format Running Head: Position:

Top Bottom None Odd Even First      Alignment: left margin Edge-of-paper

5. enter

Быстрое создание колонтитулов:

1-3 - то же самое

4. верхний  колонтитул: Ctrl+F2

нижний колонтитул: Alt+F2

На каждой странице может быть не более двух колонтитулов: верхний и нижний

Выравнивание колонтитулов: Format Paragraph или Alt C, Alt R.

Вывод номера страницы/даты:

1. курсор в то место колонтитула, где будет страница.

2. набрать page/date

3. F3 


 

А также другие работы, которые могут Вас заинтересовать

34425. Государственный бюджет. Прогнозирование государственных операций при формировании госбюджета 30.5 KB
  с одной стороны государство собирает денежные средства через налоги в госбюджет а затем распределяет эти ресурсы между сферами производства и потребления между различным отраслями экономики в виде прямого бюджетного финансирования в различные социальные сферы государственные частные кооперативноколхозные региональные структуры. Происходит развитие теневой экономики. стимулирование развития экономики социальная перераспределение доходов в пользу населения отдельных секторов экономики решение проблем социального развитияю...
34426. Россия на рубеже XVI – XVII вв. Смутное время и его последствия 43.5 KB
  Начало XVII века в России произошли события вошедшие в историю под названием Смутного времени. Они были заинтересованы в отторжении западных территорий России. Появление шведов на территории России дало Сигизмунду III враждовавшему со Швецией повод для открытой интервенции. Шведы в это время оккупировали север России.
34427. Становление самодержавия Романовых в XVII в 33 KB
  После возвращения из плена отца царя Михаила Федоровича Филарета созыв соборов прекратился. Ее функции стала выполнять так называемая Ближняя государева дума составленная из доверенных лиц царя. Теперь назначение на должности стало исключительно волей царя. Человек обнаживший в присутствии царя оружие наказывался отсечением руки.
34428. Преобразования Петра I в первой четверти XVIII в.: содержание, итоги, последствия 15.24 KB
  Изменения в сословиях: По указу о единонаследии запрещалось делить имения при передаче их по наследству. Изменения в государственном управлении: В 1721 г. Изменения в области культуры: Развивалось просвещение. Произошли изменения во внешнем облике дворян.
34429. Дворцовые перевороты в России в середине XVIII века 30.5 KB
  Причины дворцовых переворотов: Указ Петра I о престолонаследии 1722 г. императором стал внук Петра I Петр II. Императрицей стала племянница Петра I Анна Иоанновна вдова герцога Курляндского. в результате дворцового переворота с помощью гвардии императрицей стала дочь Петра I Елизавета Петровна.
34430. Россия в эпоху Екатерины II. Просвещенный абсолютизм 27.5 KB
  Внутренняя политика. Политика Екатерины II известна как политика просвещенного абсолютизма. Просвещенный абсолютизм политика сформировавшаяся под влиянием идей философов просветителей и направленная на организацию общества на основе разумных законов при сохранении абсолютной власти монарха. В результате политика Екатерины II еще больше укрепила крепостнические порядки.
34431. Противоречивость внутренней политики Александра I 32 KB
  После Отечественной войны 1812 года в настроении Александра I произошли большие перемены.Аракчеев поэтому этот период правления Александра I получил название аракчеевщина.
34432. Отечественная война 1812 г. и заграничный поход русской армии (1813 – 1814 гг.) 32 KB
  Причины войны: Россия нарушала условия невыгодного для нее Тильзитского мира и была препятствием на пути Наполеона к мировому господству. На границе с Россией Наполеон сосредоточил 600тысячную армию. Бородинское сражение в котором Наполеон стремился разгромить русскую армию. Наполеон не достиг своей цели.
34433. Россия в годы правления Николая I 37.5 KB
  в России начинается промышленный переворот переход от ручного труда к машинному от мануфактуры к фабрике. Турция стремилась вернуть территории утраченные в войнах с Россией Англия и Франция стремились не допустить усиление влияния России на Балканах и Ближнем Востоке. Основные военные действия развернулись в Крыму где противники России высадили десант и осадили Севастополь. Причины поражения России: Военнотехническая отсталость России Дипломатические просчеты: Россия оказалась в изоляции Итоги: Поражение России в Крымской войне...