23599

Автоматизация анализа письменного текста: основные подходы к решению проблемы

Доклад

Иностранные языки, филология и лингвистика

ТБД автоматизированная система инвентаризации и машинного представления терминологической лексики и ее семантизации в системах машинного и человекомашинного речевого общения. Научные задачи: моделирование терминологической системы РЯ как системы подсистем построение общенаучных и общетеоретических тезаурусов исследование русской терминологии Типы традиционного использования ТБД: справочноинформационное обслуживание специалистов различных областей знания обеспечение традиционного перевода научнотехнической литературы обеспечение АСОТ...

Русский

2013-08-05

16 KB

1 чел.

Билет 14

1. Автоматизация анализа письменного текста: основные подходы к решению проблемы.

Существует 2 основные стратегии решения проблемы:

1. модульный подход - последовательный анализ по уровням (морфологический, синтаксический, семантический, прагматический)

2. интегральный подход (более современный и более адекватный, Р. Шенк)

1.   Системы модульного типа (Леонтьева):

модуль морфологического анализа

-> полное морф. представление

модуль синтаксического анализа

-> полное синт.представление

модуль семантического анализа

-> частичное (фрагментарное) представл.

прагматический анализ

(пока не реализован)

Для широких ПО может быть использован в нескольких системах:

СМП (SYSTRAN)

системах извлечения знаний

ИПС

2.   Системы интегрального типа

Концептуальный анализ

->

фрагментарные концептуальные представления:

морф.анализ

синт.анализ

сем. анализ

сценарии, фреймы. планы.

Ищет в тексте диагностические слова

заполняет пустые слоты в сценарии

делает ряд концептуальных выводов (inferences) о смысле текста (в результате чего способна отвечать на поставленные вопросы по содержанию)

на определенных этапах подключает процедуры

нельзя получить уровневое представление

тексты узко ограниченной тематики

Пример: интегральная система анализа Шенка:

1. MARGE (Memory Response Generation in English) - обработка концептуальной информации.  В основе лежит теория концептуальных зависимостей - комплексная теория человеческого мышления.

Работает в двух режимах:

перефразирование (перевод входной фразы на ЯКЗ)

концептуальный вывод

2. Модель SAM (Script Applying Mechanism) является компьютерной программой, которая позволяет понимать связность текста за счет применения сценариев:

 POLITICS (ведет диалог, моделирует политическую идеологию)

 PAM  -> TALE-SPIN - порождение сказок

 FRUMP - машинное реферирование сообщений на нескольких языках, чтение , опирающееся на понятие интереса (Integral Partial Parser)

2. Терминологические банки данных: структуры, функции, методы построения.

ТБД - автоматизированная система инвентаризации и машинного представления терминологической лексики и ее семантизации в системах машинного и человеко-машинного речевого общения. Это единая служба с удобным доступом, описывающая все сведения о термине и ликвидирующая неравномерность описания терминологии.

Научные задачи:

моделирование терминологической системы РЯ как системы подсистем

построение общенаучных и общетеоретических тезаурусов

исследование русской терминологии

Типы традиционного использования ТБД:

справочно-информационное обслуживание специалистов различных областей знания

обеспечение традиционного перевода научно-технической литературы

обеспечение АСОТ, включая системы машинного перевода

лингвистическое обеспечение авт. систем информации

обеспечение работ по упорядочению терминологии

подготовка и издание терминологических словарей

унификация определенных терминов

подготовка научных отчетов о составе РЯ

Организационная структура ТБД:

терминологические центры

службы переводов (переводческая функция)

службы стандартизации (нормативная функция)

университеты (исследовательская функция)

всероссийские органы НТИ (по АСУ и ИПС)

Функциональная структура ТБД:

1. Головной ТБД - справочно-поисковый аппарат  по видовым банкам данных:

ведение коммуникативного формата данных

организация и руководство работами по передаче данных в ТБД

обработка и ввод данных

обслуживание предприятий

2. Специализированные ТБД (сбор, хранение , обработка информации), могут включать существующие ТБД, словарно-терминологические службы НТИ:

отбор представительного массива источников

ввод и обновление терминологической информации в БД

передача информации другим СТБД и ГТБД

эксплуатация СТБД в соответствии с конкретными задачами организации.

ТБД состоит из ряда массивов, которые называются подфондами.

Подфонды - массивы терминов, которые создаются и хранятся в центральном органе МФРЯ (Машинный фонд РЯ) на базе массивов первичного типа.

Подфонды:

специальных и межотраслевых терминов, фигурирующих в отдельных отраслях знаний и деятельности

общенаучных и общетехнических терминов

терминоэлементов (используются в нескольких терминосистемах).

3. Примеры оформления сложных документов (сноски, газетная верстка, колонтитулы и т. д) в MS Word 5.0.

Сноски:

1. курсор на месте символа ссылки на сноску

2. Format, Footnote

3. в поле reference mark ввести ссылку на сноску (не более 28 символов)

4. enter

5. ввести текст сноски (до нескольких абзацев)

перемещение между сноской и текстом: Jump Footnote

использование окна сносок: Esc W S F

переход из окна в окно: F1

местоположение сносок:

по умолчанию - на той же стр., где ссылка

 Format Division Layout: same page, end

Газетная верстка:

колонки:

1. Options: Show Layout Yes или Alt-F4

2. Esc Format Division Layout

колонтитулы:

1. курсор в начало документа

2. ввести текст + enter

3. курсор внутрь текста или выделить текст

4. Esc Format Running Head: Position:

Top Bottom None Odd Even First      Alignment: left margin Edge-of-paper

5. enter

Быстрое создание колонтитулов:

1-3 - то же самое

4. верхний  колонтитул: Ctrl+F2

нижний колонтитул: Alt+F2

На каждой странице может быть не более двух колонтитулов: верхний и нижний

Выравнивание колонтитулов: Format Paragraph или Alt C, Alt R.

Вывод номера страницы/даты:

1. курсор в то место колонтитула, где будет страница.

2. набрать page/date

3. F3 


 

А также другие работы, которые могут Вас заинтересовать

46076. Методика логопедического воздействия при функциональной дислалии (В 65) 25 KB
  Основной целью логопедического воздействия при дислалии является формирование умений и навыков правильного воспроизведения звуков речи. Ребенок должен научиться: узнавать звуки речи отличать один от другого по акустическим признакам; отличать нормированное произнесение звука от ненормированного; осуществлять слуховой контроль и оценивать качество произносимого звука; принимать необходимые артикуляционные позиции обеспечивающие нормированный звук; варьировать артикуляционные уклады звуков в зависимости от их сочетаемости с другими в...
46077. Ринолалия. Причины, механизмы, основные формы нарушения 29 KB
  Такое нарушения резонанса происходит в результате неправильного направления голосовой или дыхательной струи вследствие механического дефекта носовой полости носоглотки мягкого и твердого неба или расстройства функции мягкого неба. Назальный носовой оттенок речи связан с наличием широкого сообщения между ротовой и носовой полостью и недостаточным смыканием носоглоточного прохода изза укороченного мягкого неба. Расстройство звукообразования зависит : от нарушения деятельности мышечного аппарата мягкого неба глотки и языка; от...
46078. Система коррекционного воздействия при ринолалии в дооперационный период 29.5 KB
  Коррекция гласных предусматривает продвижение языка к нижним зубам и произнесение их на диафрагмальном выдохе в грудном регистре. Начинают с протяжного произнесения гласных ааа эээ на мягком выдохе в грудном регистре. Постановка гласных начинается с а и э которые к этому времени достаточно отработаны артикуляционными упражнениями. Это обусловлено на изменении силы необходимой для удержания сегментов неба в горизонтальном положении и на возрастании объема глоточной полости при артикуляции гласных из которых у и обладают наиболее...
46079. Система коррекционного воздействия при ринолалии в послеоперационный период 28.5 KB
  Постановка гласных звуков. Занятия снова начинают с проговаривания гласных звуков а и э. Как только небо станет удерживаться в подъеме 1 2 секунды следует приступать к нормализации резонанса гласных звуков. Ребенок упражняется в начале в проговаривании изолированных гласных звуков а затем в сочетаниях по 23 звука.
46080. Характеристика различных аспектов изучения дизартрии 14 KB
  Характеристика различных аспектов изучения дизартрии. Основные проявления дизартрии состоят в расстройстве артикуляции звуков нарушениях голосообразования а также в изменениях темпа речи ритма и интонации. Причинами дизартрии являются органические поражения центральной нервной системы в результате воздействия различных неблагоприятных факторов на развивающийся мозг ребенка во внутриутробном и раннем периодах развития. Клиническая картина дизартрии впервые была описана более ста лет назад у взрослых в рамках псевдобульбарного...
46081. Дизартрия. Этиология, механизмы нарушения, симптоматика 19.5 KB
  Этиология дизартрии определяется органическим поражением центральной и периферической нервной системы под влиянием различных неблагоприятных внешних экзогенных факторов воздействующих во внутриутробном периоде развития в момент родов и после рождения. Основными признаками дизартрии являются дефекты звукопроизношения и голоса сочетающиеся с нарушениями речевой моторики и речевого дыхания. При дизартрии в отличие от дислалии может нарушаться произношение как согласных так и гласных звуков. В зависимости от нарушений все дефекты...
46082. Классификация дизартрии, характеристика основных форм и степеней нарушения 35 KB
  У детей с описываемой формой дизартрии наблюдается атрофия мышц языка и глотки снижается также тонус мышц атония. Иногда при подкорковой дизартрии у детей наблюдается снижение слуха осложняющее речевой дефект. Наблюдается инертность иннервационного импульса. Наблюдается при поражении мозжечка и его связей с другими отделами ЦНС.
46083. Характеристика основных направлений коррекционной работы при различных формах дизартрии 29 KB
  Развитие артикуляционной моторики речевого дыхания постановка и закрепление звуков в речи. Важная задача развитие слухового восприятия и звукового анализа а также восприятия и воспроизведения ритма. Основная цель: развитие речевого общения и звукового анализа. Проводится работа по коррекции артикуляционных нарушений: при спастичности расслабление мышц артикуляционного аппарата выработка контроля над положением рта развитие артикуляционных движений развитие голоса; коррекция речевого дыхания; развитие ощущений артикуляционных движений...
46084. Этиология и классификация нарушений голоса 27.5 KB
  Этиология и классификация нарушений голоса. Проблема нарушений голоса у детей остается актуальной так как голосовые перегрузки связанные с коллективным воспитанием ребенка в д с участие в разнообразных вокальных и хоровых коллективах не имеющих опытных педагогов экологические и социальные проблемы приводят к тому что в фониатрической и логопедической практике нередко приходится сталкиваться с детьми страдающими заболеваниями голосового аппарата. Нарушения голоса это отсутствие или расстройство фонации вследствие патологических...