23589

Автоматизированные переводные словари. Принципы построения

Доклад

Иностранные языки, филология и лингвистика

Зона лексического грамматического класса ЛЕ по частям речи далее категоризация. Зона морфологической информации 4. Зона индекса надежности отражает степень общепринятости данного ПЭ: А официальный стандарт Б уважаемые словари В тетради новых терминов Г плавающие 6. Зона ПЭ при нескольких ПЭ у каждого свой номер 7.

Русский

2013-08-05

11.5 KB

1 чел.

2. Автоматизированные переводные словари. Принципы построения.

АС - это словарь, который при переводе некоторые операции делает за человека. Компьютерный словарь - аналог бумажного на магнитных носителях.  АС = ТБД с общеупотребительной лексикой. EURODICAUTOM (11, 1.200.000 ЛЕ), LEXIS (8, 1.500.000 ЛЕ).

Отличительные свойства АС:

многоязычие

 обратимость ( полная: всякая ЛЕ может выступать в роли входной при запросе и выходной при ответе; частичная: наличие индекса)

 гибкость (удобное, упрощенное обращение к словарю: несколько входов в словарь)

 динамичность (постоянное пополнение словарного состава; оперативность редактирования)

 состав (структура) словаря:

макроструктура - структура словаря:

микроструктура - структура словарной статьи

основная  единица словаря

слово (композиционно)

словосочетание (статистически); 80% обращений к словарю - СС; причина -уклон в терминологию

3 главных компонента АС:

 блок обработки запроса (блок лемматизации - сведения текстовых форм к их словарным (каноническим) форме)

 блок лексических массивов (в АС ЛЕ могут храниться и в виде основ, и виде словоформ)

( блок морфологического анализа) (иногда)

 блок выдачи ответа (ПЭ; главная задача - варьирование ответа в зависимости от пожеланий пользователя)

Желательно также, чтобы АС обладал:

блоком лемматизации

алгоритмом обработки некорректных запросов

алгоритмом словообразовательного анализа)

АС не СМП, он берет на себя только работу с лексемой, оставляя человеку проблему выбора ПЭ и синтеза текста.  На вход АПС поступают отдельные слова и СС, с помощью анализа которых можно получить сведения о грамм. классе слова и его грамм. форме.  решить на основании этой информации проблемы омонимии и многозначность, определить синтас. функцию ПЭ в тексте невозможно, поэтому разработчики АПС таких задач перед собой и не ставят. Тем не менее индекс тематической принадлежности в какой-то мере разрешает многозначность лексики.

Словарная статья:

Ее структура и наполнение определяется назначением словаря.

Структура словарной статьи (13 зон):

1. Заголовок - основа, СС (больше всех по количеству), морфема, фрагменты текста

2. Зона лексического грамматического класса - ЛЕ по частям речи, далее - категоризация.

3. Зона морфологической информации

4. Рубрика  подрубрика  стиль (вся информация - в виде цифровых кодов)

5. Зона индекса надежности отражает степень общепринятости данного ПЭ:

А - официальный стандарт

Б - уважаемые словари

В - тетради новых терминов

Г - плавающие

6. Зона ПЭ (при нескольких ПЭ - у каждого свой номер)

7. Зона пояснительных помет - уточнение значения данной ЛЕ

семантические

лексические

синтаксические (обязат. управление)

8. Зона толкований (для многозначных слов и новых терминов)

9. Зона примеров употребления выполняет две функции:

иллюстративную

смыслоразличительную

10. Зона фразеологии.

11. Составитель словарной статьи

12. Источник составления словарной статьи  -> необязательные

13. Дата составления словарной статьи


 

А также другие работы, которые могут Вас заинтересовать

75195. Искусственные языки 27 KB
  Искусственные языки Система изучающая данную область называется Интерлингвистика Она изучает аналоги человеческого языка и языки используемые в узколокальных целях например машинные языки Эсперанто окциденталь или интерлингве идо волапюк – это искусственные языки которые изначально создавались с целью преодоления языкового барьера который существует в человечестве легенда о языковом барьере появилась ещё в дохристианское время во время строительства Вавилонской башни. в Варшаве появился проект языка эсперанто составленный...
75196. Язык и культура 22.01 KB
  Язык и культура. Язык самым тесным образом связан с культурой. Вопросом связи языка и культуры начали заниматься в конце 18 начале 19 в. Вильгельм фон Гумбольдт Гумбольдт утверждал что язык и материальная культура связаны.
75197. Просторечие и жаргон 30.5 KB
  Литературное просторечие – это когда в речи образованного человека встречается фамильярная лексика: братан земляк пацан батя к пожилому мужчине. Следует различать салонные жаргоны социальной верхушки которые возникают из ложной моды как стилистический нарост на нормальном языке; практической ценности в них нет; особенно опасно их проникновение в литературу и практические жаргоны исходящие из профессиональной речи и преследующие цели языкового обособления данной группы и тайноречия для осуществления своего ремесла и засекречивания...
75198. Функциональная классификация языков 19.85 KB
  Существует несколько видов социолингвистической классификации языков: Существуют языки-гиганты. Эти языки являются рабочими языками ООН: английский немецкий франц. Дело в том что носители малых языков просто переходят на языки более крупные более распространенные так как малые языки – неэффективны. Существует Красная книга языков России в которой перечисляются языки наиболее редкие.
75199. Общенациональный язык как система форм существования языка 43.5 KB
  Синтагматические связи и парадигматические отношения. Иерархические отношения в системе языка. Существует 3 типа системных отношений в языке: Синтагматические связи Парадигматические отношения Иерархические отношения Синтагматические связи связи и зависимости между языковыми элементами единицами любой сложности одновременно сосуществующими в линейном ряду тексте речи например между соседними звуками. На синтагматических отношениях строятся слова как совокупность морфем и слогов словосочетания и аналитические наименования...
75200. Искусственные языки 19.78 KB
  Искусственные языки Система изучающая данную область называется Интерлингвистика Она изучает аналоги человеческого языка и языки используемые в узколокальных целях например машинные языки Эсперанто окциденталь или интерлингве волапюк – это искусственные языки которые изначально создавались с целью преодоления языкового барьера который существует в человечестве легенда о языковом барьере появилась ещё в дохристианское время во время строительства Вавилонской башни. в Варшаве появился проект языка эсперанто составленный...
75201. Языковые ситуации и их виды 44.5 KB
  Языковая ситуация – это совокупность языков или форм существования одного языка а также социальные и функциональные отношения между ними на определенной территории. Языковая ситуация складывается постепенно и определяется языковой политикой. Выделяется 3 класса языков: крупные говорит не менее 25 населения малые меньше 25 особые языки употребляющиеся в определенной сфере деятельности Формула СтюартсФюргюсона американский социолингвист 5L=2Lmj1Lmin2Lspec Spin 5 языков=испанскийкаталанский баскский ...