23589

Автоматизированные переводные словари. Принципы построения

Доклад

Иностранные языки, филология и лингвистика

Зона лексического грамматического класса ЛЕ по частям речи далее категоризация. Зона морфологической информации 4. Зона индекса надежности отражает степень общепринятости данного ПЭ: А официальный стандарт Б уважаемые словари В тетради новых терминов Г плавающие 6. Зона ПЭ при нескольких ПЭ у каждого свой номер 7.

Русский

2013-08-05

11.5 KB

1 чел.

2. Автоматизированные переводные словари. Принципы построения.

АС - это словарь, который при переводе некоторые операции делает за человека. Компьютерный словарь - аналог бумажного на магнитных носителях.  АС = ТБД с общеупотребительной лексикой. EURODICAUTOM (11, 1.200.000 ЛЕ), LEXIS (8, 1.500.000 ЛЕ).

Отличительные свойства АС:

многоязычие

 обратимость ( полная: всякая ЛЕ может выступать в роли входной при запросе и выходной при ответе; частичная: наличие индекса)

 гибкость (удобное, упрощенное обращение к словарю: несколько входов в словарь)

 динамичность (постоянное пополнение словарного состава; оперативность редактирования)

 состав (структура) словаря:

макроструктура - структура словаря:

микроструктура - структура словарной статьи

основная  единица словаря

слово (композиционно)

словосочетание (статистически); 80% обращений к словарю - СС; причина -уклон в терминологию

3 главных компонента АС:

 блок обработки запроса (блок лемматизации - сведения текстовых форм к их словарным (каноническим) форме)

 блок лексических массивов (в АС ЛЕ могут храниться и в виде основ, и виде словоформ)

( блок морфологического анализа) (иногда)

 блок выдачи ответа (ПЭ; главная задача - варьирование ответа в зависимости от пожеланий пользователя)

Желательно также, чтобы АС обладал:

блоком лемматизации

алгоритмом обработки некорректных запросов

алгоритмом словообразовательного анализа)

АС не СМП, он берет на себя только работу с лексемой, оставляя человеку проблему выбора ПЭ и синтеза текста.  На вход АПС поступают отдельные слова и СС, с помощью анализа которых можно получить сведения о грамм. классе слова и его грамм. форме.  решить на основании этой информации проблемы омонимии и многозначность, определить синтас. функцию ПЭ в тексте невозможно, поэтому разработчики АПС таких задач перед собой и не ставят. Тем не менее индекс тематической принадлежности в какой-то мере разрешает многозначность лексики.

Словарная статья:

Ее структура и наполнение определяется назначением словаря.

Структура словарной статьи (13 зон):

1. Заголовок - основа, СС (больше всех по количеству), морфема, фрагменты текста

2. Зона лексического грамматического класса - ЛЕ по частям речи, далее - категоризация.

3. Зона морфологической информации

4. Рубрика  подрубрика  стиль (вся информация - в виде цифровых кодов)

5. Зона индекса надежности отражает степень общепринятости данного ПЭ:

А - официальный стандарт

Б - уважаемые словари

В - тетради новых терминов

Г - плавающие

6. Зона ПЭ (при нескольких ПЭ - у каждого свой номер)

7. Зона пояснительных помет - уточнение значения данной ЛЕ

семантические

лексические

синтаксические (обязат. управление)

8. Зона толкований (для многозначных слов и новых терминов)

9. Зона примеров употребления выполняет две функции:

иллюстративную

смыслоразличительную

10. Зона фразеологии.

11. Составитель словарной статьи

12. Источник составления словарной статьи  -> необязательные

13. Дата составления словарной статьи


 

А также другие работы, которые могут Вас заинтересовать

20206. Контроль загрязнения почв 38 KB
  Кроме ПДК в номенклатуру санитарного состояния почв входят показатели: Общее количество аммонийного азота. Общее количество нитратного азота. Общее количество хлоридов. Общее количество пестицидов.
20207. ИССЛЕДОЛВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ СИСТЕМ 96 KB
  Для получения равноплечной дифференциальной системы соединяются дужками гнезда 10 16 при этом коэффициенты трансформации равны: Для получения неравноплечной дифференциальной системы соединяются дужками гнезда 10 16 при этом коэффициент трансформации равны Резисторная дифференциальная схема состоит из четырех резистров по 600 Ом образующих равноплечный мост рис. Для этого соединить дужкой гнезда 11 16 а к гнездам ГЕН 23 27 подключить измерительный генератор с частотой...
20208. ИЗУЧЕНИЕ ОКОНЕЧНОЙ АППАРАТУРЫ СИСТЕМЫ ПЕРЕДАЧИ К - 60П 148.5 KB
  Шестидесятиканальная система передачи на транзисторах К 60П предназначена для уплотнения симметричного кабеля диаметром жил 12мм в спектре частот 12 252 кГц. Работой устройств АРУ управляют токи контрольных частот: 16кГц наклонная 112 кГц криволинейная 248 кГц плоская. Индивидуальное преобразование спектра частот 03 34 кГц каждого из 12 каналов тональной частоты осуществляется соответственно с помощью одной из несущих частот: 108; 104; ; 64 кГц. В результате этого преобразования образуется спектр стандартной первичной...
20209. ИЗУЧЕНИЕ КОДИРУЮЩЕГО УСТРОЙСТВА 33 KB
  Сигнал на выходе компаратора зависит от соотношения Iвх и Iэт если Iвх Iэт на выходе компаратора логическая 1 . Если Iвх Iэт на выходе компаратора логический 0 . Сигнал строб 1 формирует импульс кодовой группы а сигнал строб 2 в зависимости от решения компаратора оставляет эталонный ток включенным до конца кодирования отсчета если Iвх Iэт или выключает эталонный ток данного разряда если Iвх Iэт. Наименование импульсов Амплитуда Примечание ТИ Строб 1 Строб 2 РИ 2вых Iэт 23 = 8 Iэт 22 = 4 Iэт 21 = 2 Iэт 20 = 1...
20210. ИССЛЕДОВАНИЕ РЕГЕНЕРАТОРА ЦСП 35 KB
  Подключить шнуры питания макета и измерительные приборы к розеткам сеть 220В . Включить тумблеры питания настроить измерительные приборы. Исследовать работу датчика кодовых групп ДКГ: поставить на макете ключ 1 в положение РУЧ при этом работой ДКГ можно управлять вручную кнопкой при помощи ручного датчика импульсов РДИ для контроля состояния комбинации кодовой группы используются светодиоды; при помощи шнуров подключить 1ый вход осциллографа к выходу ДКГ и настроить осциллограф на неподвижное изображение импульсов на экране для этого...
20211. НЕОБСЛУЖИВАЕМЫЙ РЕГЕНЕРАЦИОННЫЙ ПУНКТ НРП-К12 СИСТЕМЫ ПЕРЕДАЧИ ИКМ-30 57.5 KB
  Ознакомиться с составом оборудования и конструкцией НРПК12 ИКМ30. Изучить структурную схему НРП. Оборудование НРП.
20212. ПРИНЦИПЫ ПОСТРОЕНИЯ МНОГОКАНАЛЬНОЙ СИСТЕМЫ ПЕРЕДАЧИ С ЧАСТОТНЫМ РАЗДЕЛЕНИЕМ КАНАЛОВ 1.32 MB
  Источниками первичных сигналов являются генераторы синусоидальных сигналов Г. Зарисовать осциллограмму следующих сигналов: первичных сигналов первого второго и третьего каналов форму напряжений на выходе генераторов Г; несущих частот этих каналов гнезда 789; на выходе каждого модулятора предварительно соединив дужкой источник первичного сигнала с соответствующим модулятором; на выходе каждого канального фильтра; группового сигнала: а для случая одного канального сигнала; б для случая двух канальных сигналов; в для случая трех...
20213. ИЗУЧЕНИЕ ПРИНЦИПОВ ПОСТРОЕНИЯ АППАРАТУРЫ МНОГОКАНАЛЬНОЙ СВЯЗИ С РАЗДЕЛЕНИЕМ КАНАЛОВ ПО ВРЕМЕНИ 77.5 KB
  Соединив гнезда 12 14 и 16 17 включают между ними усилитель имитирующий линию с нелинейными искажениями. Зарисовать осциллограмму следующих сигналов: первичных сигналов одного канала например первого гнездо 1; групповой сигнал на выходе сумматора гнездо 12 предварительно соединив дужкой гнезда 1 2; сигналы в точках 26 и 29 соединив дужками гнезда 12 13 15 17. Групповой сигнал на выходе сумматора гнездо 12 при подключении всех трех каналов соединив дужками гнезда 2 4 5 6. Подключить усилитель имитирующий линию с...
20214. ИССЛЕДОВАНИЕ ЭЛЕКТРИЧЕСКИХ ХАРАКТЕРИСТИК КАНАЛА ТОНАЛЬНОЙ ЧАСТОТЫ 90.5 KB
  Исследование основных электрических характеристик канала тональной частоты ТЧ. Изучение характеристик канала ТЧ и методов их измерения. Измерение характеристик канала ТЧ.