23589

Автоматизированные переводные словари. Принципы построения

Доклад

Иностранные языки, филология и лингвистика

Зона лексического грамматического класса ЛЕ по частям речи далее категоризация. Зона морфологической информации 4. Зона индекса надежности отражает степень общепринятости данного ПЭ: А официальный стандарт Б уважаемые словари В тетради новых терминов Г плавающие 6. Зона ПЭ при нескольких ПЭ у каждого свой номер 7.

Русский

2013-08-05

11.5 KB

1 чел.

2. Автоматизированные переводные словари. Принципы построения.

АС - это словарь, который при переводе некоторые операции делает за человека. Компьютерный словарь - аналог бумажного на магнитных носителях.  АС = ТБД с общеупотребительной лексикой. EURODICAUTOM (11, 1.200.000 ЛЕ), LEXIS (8, 1.500.000 ЛЕ).

Отличительные свойства АС:

многоязычие

 обратимость ( полная: всякая ЛЕ может выступать в роли входной при запросе и выходной при ответе; частичная: наличие индекса)

 гибкость (удобное, упрощенное обращение к словарю: несколько входов в словарь)

 динамичность (постоянное пополнение словарного состава; оперативность редактирования)

 состав (структура) словаря:

макроструктура - структура словаря:

микроструктура - структура словарной статьи

основная  единица словаря

слово (композиционно)

словосочетание (статистически); 80% обращений к словарю - СС; причина -уклон в терминологию

3 главных компонента АС:

 блок обработки запроса (блок лемматизации - сведения текстовых форм к их словарным (каноническим) форме)

 блок лексических массивов (в АС ЛЕ могут храниться и в виде основ, и виде словоформ)

( блок морфологического анализа) (иногда)

 блок выдачи ответа (ПЭ; главная задача - варьирование ответа в зависимости от пожеланий пользователя)

Желательно также, чтобы АС обладал:

блоком лемматизации

алгоритмом обработки некорректных запросов

алгоритмом словообразовательного анализа)

АС не СМП, он берет на себя только работу с лексемой, оставляя человеку проблему выбора ПЭ и синтеза текста.  На вход АПС поступают отдельные слова и СС, с помощью анализа которых можно получить сведения о грамм. классе слова и его грамм. форме.  решить на основании этой информации проблемы омонимии и многозначность, определить синтас. функцию ПЭ в тексте невозможно, поэтому разработчики АПС таких задач перед собой и не ставят. Тем не менее индекс тематической принадлежности в какой-то мере разрешает многозначность лексики.

Словарная статья:

Ее структура и наполнение определяется назначением словаря.

Структура словарной статьи (13 зон):

1. Заголовок - основа, СС (больше всех по количеству), морфема, фрагменты текста

2. Зона лексического грамматического класса - ЛЕ по частям речи, далее - категоризация.

3. Зона морфологической информации

4. Рубрика  подрубрика  стиль (вся информация - в виде цифровых кодов)

5. Зона индекса надежности отражает степень общепринятости данного ПЭ:

А - официальный стандарт

Б - уважаемые словари

В - тетради новых терминов

Г - плавающие

6. Зона ПЭ (при нескольких ПЭ - у каждого свой номер)

7. Зона пояснительных помет - уточнение значения данной ЛЕ

семантические

лексические

синтаксические (обязат. управление)

8. Зона толкований (для многозначных слов и новых терминов)

9. Зона примеров употребления выполняет две функции:

иллюстративную

смыслоразличительную

10. Зона фразеологии.

11. Составитель словарной статьи

12. Источник составления словарной статьи  -> необязательные

13. Дата составления словарной статьи


 

А также другие работы, которые могут Вас заинтересовать

72641. Структурный IF 21.71 KB
  Сначала вычисляется условие e, а затем в зависимости от его истинности выполняется на выбор один из двух блоков, а после этого - следующий оператор. Один оператор if можно вкладывать в другой оператор IF. Один из таких случаев вложения, а именно if в блок НЕТ другого IF допускает...
72642. ЛОГИЧЕСКИЕ ВЫРАЖЕНИЯ 14.43 KB
  Логическими данными могут быть не только переменные и константы логического типа. Данные или выражения любого встроенного типа связанные операцией логического отношения образуют конструкцию логического типа. Такие конструкции могут входить в логические выражения наравне с логическими переменными и константами.
72643. Условные операторы 23.83 KB
  Условные операторы позволяют выбирать одно из нескольких возможных продолжений процесса программы. Имеется несколько форм условных операторов, из которых самым мощным и простым является структурный оператор IF.
72644. Последовательность выполнения операторов в программной единице 12 KB
  Главная программа является ведущей программной единицей, и обработка всей программы всегда начинается с первого исполняемого оператора главной программы. Обычно главную программу располагают в начале всей программы, т.к. этого требуют некоторые компиляторы; за главной программой следуют подпрограммы.
72645. Последовательность выполнения операторов в программной единице 12.99 KB
  Любая программная единица представляет собой последовательность операторов и комментариев. Комментарии могут располагаться в любом месте программной единицы. Они не влияют на ход выполнения программы. Порядок следования операторов в программе существен.
72646. Логические выражения 14.67 KB
  Результатом логического выражения является величина типа LOGICAL. Простейшие формы логических выражений следующие: Логические константы. Ссылки на логические переменные. Ссылки на элементы логических массивов. Ссылки на логические функции. Выражения отношения.
72647. Арифметические выражения 13.77 KB
  Используемые величины переменных или элементов массивов должны быть определены до того, как они появятся в арифметическом выражении. Также, величины целых переменных должны быть арифметическими, а не величинами меток операторов, установленными оператором ASSIGN.
72648. Размещение элементов массива в памяти ЭВМ 11.81 KB
  Если массив одномерный то его элементы хранятся в памяти друг за другом например А1 А2 А3 А4 Во многих языках программирования например в СИ элементы двумерного массива располагаются в памяти ЭВМ по строкам в Фортране по столбцам.
72649. Понятие массива 18.25 KB
  Каждый массив должен быть описан в начале программы с помощью оператора размерности DIMENSION с указанием предельных значений каждого индекса, которые задаются целыми константами. Это необходимо для того, чтобы зарезервировать соответствующий объем памяти для хранения элементов массива.