75888

Комп’ютерні технології і сучасна лексикографічна наука

Доклад

Иностранные языки, филология и лингвистика

Множество различных компьютерных лексикографических программ можно разделить на две больших группы: программы поддержки лексикографических работ и автоматические словари АС различных типов включающие лексикографические базы данных. Автоматические словари. Иными словами различаются автоматические словари конечного...

Украинкский

2015-01-26

26.72 KB

0 чел.

34. Комп’ютерні технології і сучасна лексикографічна наука.

Современная лексикография существенно расширила и усилила свой инструментарий компьютерными технологиями создания и эксплуатации словарей. Специальные программы — базы данных, компьютерные картотеки, программы обработки текста — позволяют в автоматическом режиме формировать словарные статьи, хранить словарную информацию и обрабатывать ее. Множество различных компьютерных лексикографических программ можно разделить на две больших группы: программы поддержки лексикографических работ и автоматические словари (АС) различных типов, включающие лексикографические базы данных.

Компьютерные программы поддержки лексикографических работ. Работа лексикографа непосредственно связана со словами, примерами их употребления и словарными статьями создаваемого словаря. Традиционная форма фиксации словарных данных — каталожная карточка, в которой указывается описываемое слово, пример употребления, источник примера, автор, а также различная дополнительная информация. Современные компьютерные технологии позволяют упростить процесс сбора и хранения лексикографической информации, используя вместо обычной картотеки базу данных, записи которой представляют собой аналог традиционной каталожной карточки. В отличие от обычной картотеки, записи базы данных дают возможность автоматически сортировать массив по выбранным параметрам, отбирать нужные примеры, объединять их в группы и т. д.

Еще один важный этап лексикографической работы — поиск примеров на слово и формирование картотеки примеров. В традиционной технологии сбор примеров производится вручную и отнимает огромное количество времени. Современные компьютерные программы дают возможность выбирать примеры на нужное слово из корпусов текстов, хранящихся в машинном формате на компьютере, в автоматическом режиме.

После подготовки первичного словарного материала — словарной картотеки — непосредственно следует этап составления словарной статьи. Технологическая цепочка словарных работ и здесь не остается без компьютерной поддержки. Новая словарная статья вводится в базу данных, которая становится исходной базой данных создаваемого словаря. Редактирование словарных статей также происходит в базе данных, а не в обычном текстовом файле.

Наконец, последний этап — формирование текста словаря, создание оригинал-макета книги — также существенно облегчается.

Автоматические словари. Автоматический словарь — это словарь в специальном машинном формате, предназначенный для испюльзования на ЭВМ пользователем или компьютерной программой обработки текста. Иными словами, различаются автоматические словари конечного пользователя-человека (АСКП) 16) и автоматические словари для программ обработки текста (АСПОТ). Автоматические словари, предназначенные для конечного пользователя, по интерфейсу и структуре словарной статьи существенно отличаются от АС, включенных в системы машинного перевода, системы автоматического реферирования, информационного поиска и т. д. Чаще всего они являются компьютерными версиями хорошо известных обычных словарей. Так, на рынке программного обеспечения имеются компьютерные аналоги толковых словарей английского языка (автоматический Вебстер, автоматический толковый словарь английского языка издательства «Коллинз», автоматический вариант «Нового большого англо-русского словаря»)

Автоматические словари такого типа практически повторяют структуру словарной статьи обычных словарей, однако они обладают функциями, недоступными своим прототипам. Например, многие АСКП позволяют осуществлять сортировку данных по полям словарной статьи (ср. отбор всех прилагательных), проводить автоматический поиск всех вокабул, имеющих в толковании определенный семантический компонент и т. д.

Автоматические словари для программ обработки текста можно назвать автоматическими словарями в точном смысле. Они, как правило, не предназначены для обычного пользователя. Особенности их структуры, сфера охвата словарного материала задаются теми программами, которые с ними взаимодействуют. Так, количество зон словарной статьи такого словаря может варьировать от одной до сотни. Чрезвычайно разнообразны и области лексикографического описания. Это может быть синтаксический словарь, семантический словарь, словарь морфем, псевдооснов, словарь устойчивых словосочетаний и т.д. АС, используемые в системах информационного поиска, имеют вид тезаурусов, а АС систем машинного перевода включают подробную информацию о морфологических, синтаксических и семантических особенностях функционирования слова.

Наиболее известные автоматические переводные словари, как правило, являются многоязычными. Так, AC LEXIC содержит лексикофа-фические данные по немецкому, английскому, французскому, русскому, итальянскому, датскому и португальскому языкам

Важным типом АС являются автоматические словари конкордансов, содержащие в машинном виде примеры на употребление всех слов (словоформ), представленных в конкретном произведении или в творческом наследии писателя.


 

А также другие работы, которые могут Вас заинтересовать

69277. Клас Cedit. Клас CListBox 54.5 KB
  Елемент управління поле введення (edit control), що інкапсулюється класом CEdit, є прямокутне дочірнє вікно, в якому користувач може вводити дані. Як правило, це найбільший елемент управління в додатку. Змінюючи стилі цього елементу управління, можна отримати все, що завгодно...
69278. Немодальні діалогові вікна 79 KB
  Визначення створення і контроль за тривалістю існування немодального діалогового вікна здійснюються впродовж семи етапів. Створення ресурсу шаблону діалогового вікна. Звернете увагу діалогові вікна в немодальному режимі не мають ніяких спеціальних стилів.
69279. Драйвер ODBC. Підключення до потоку даних. Запит даних 50 KB
  Система управління базами даних (DBMS — Database Management System). DBMS є програмним забезпеченням, що надає доступ до структурованих даних і забезпечує можливість маніпулювання ними. Прикладами найбільш популярних DBMS є Microsoft Access, Microsoft SQL Server...
69280. Підготовка і виконання запиту. Отримання даних. Відключення 41 KB
  Останнє, що додаток повинен зробити після підключення до джерела даних, але перш, ніж воно буде здатне здійснювати запити SQL, — це отримати дескриптор оператора (statement handle) або hstmt. Щоб отримати дескриптор hstmt, достаточш оголосити змінну типу SQLHSTMT і викликати функцію...
69281. Створення першого проекту Visual Studio 105.5 KB
  В меню File (Файл) виберіть пункти New (Створити), вкладку Project (Проект) або натиснути комбінацію клавіш Ctrl+Shift+N. У будь-якому випадку на екрані з’явиться діалогове вікно New Project (мал. 1.4), що дозволяє створювати всі типи проектів Visual Studio.
69282. Динамічний обмін даними. Функція Initlnstance 74.5 KB
  Динамічний обмін даними (DDX — Dynamic Data Exchange) — це засіб, за допомогою якого можна легко передавати дані між елементами управління діалогового вікна і змінними-членами додатку. Щоб створити змінну DDX, досить клацнути на елементі управління в ресурсах шаблону...
69283. Обробники подій. Концепція документ/представлення 82 KB
  Як відомо, операційна система Windows використовує модель, керовану подіями (event-driven). Це означає, що замість послідовного набору команд додаток містить цикл повідомлень (message loop), який обробляє повідомлення (або події), передавані додатку операційною системою Windows.
69284. Клас CDocument 49 KB
  Клас CDocument забезпечує стандартну поведінка об’єктів документа додатку MFC. Клас CDocument дозволяє створювати нові документи, зберігати дані документа на диску (сериализация), забезпечувати стандартну взаємодію між об’єктом документа і вікном уявлення...
69285. Документи і обробка повідомлень 34.5 KB
  Одне з найбільш важливих достоїнств документа в тому, що об’єкт CDocument не пов’язаний з вікном безпосередньо. Проте, саме об’єкт CDocument і є адресатом передаваних команд. Отже, цей об’єкт може отримувати повідомлення від операційної системи. Відповідальність за передачу повідомлень...