75888

Комп’ютерні технології і сучасна лексикографічна наука

Доклад

Иностранные языки, филология и лингвистика

Множество различных компьютерных лексикографических программ можно разделить на две больших группы: программы поддержки лексикографических работ и автоматические словари АС различных типов включающие лексикографические базы данных. Автоматические словари. Иными словами различаются автоматические словари конечного...

Украинкский

2015-01-26

26.72 KB

0 чел.

34. Комп’ютерні технології і сучасна лексикографічна наука.

Современная лексикография существенно расширила и усилила свой инструментарий компьютерными технологиями создания и эксплуатации словарей. Специальные программы — базы данных, компьютерные картотеки, программы обработки текста — позволяют в автоматическом режиме формировать словарные статьи, хранить словарную информацию и обрабатывать ее. Множество различных компьютерных лексикографических программ можно разделить на две больших группы: программы поддержки лексикографических работ и автоматические словари (АС) различных типов, включающие лексикографические базы данных.

Компьютерные программы поддержки лексикографических работ. Работа лексикографа непосредственно связана со словами, примерами их употребления и словарными статьями создаваемого словаря. Традиционная форма фиксации словарных данных — каталожная карточка, в которой указывается описываемое слово, пример употребления, источник примера, автор, а также различная дополнительная информация. Современные компьютерные технологии позволяют упростить процесс сбора и хранения лексикографической информации, используя вместо обычной картотеки базу данных, записи которой представляют собой аналог традиционной каталожной карточки. В отличие от обычной картотеки, записи базы данных дают возможность автоматически сортировать массив по выбранным параметрам, отбирать нужные примеры, объединять их в группы и т. д.

Еще один важный этап лексикографической работы — поиск примеров на слово и формирование картотеки примеров. В традиционной технологии сбор примеров производится вручную и отнимает огромное количество времени. Современные компьютерные программы дают возможность выбирать примеры на нужное слово из корпусов текстов, хранящихся в машинном формате на компьютере, в автоматическом режиме.

После подготовки первичного словарного материала — словарной картотеки — непосредственно следует этап составления словарной статьи. Технологическая цепочка словарных работ и здесь не остается без компьютерной поддержки. Новая словарная статья вводится в базу данных, которая становится исходной базой данных создаваемого словаря. Редактирование словарных статей также происходит в базе данных, а не в обычном текстовом файле.

Наконец, последний этап — формирование текста словаря, создание оригинал-макета книги — также существенно облегчается.

Автоматические словари. Автоматический словарь — это словарь в специальном машинном формате, предназначенный для испюльзования на ЭВМ пользователем или компьютерной программой обработки текста. Иными словами, различаются автоматические словари конечного пользователя-человека (АСКП) 16) и автоматические словари для программ обработки текста (АСПОТ). Автоматические словари, предназначенные для конечного пользователя, по интерфейсу и структуре словарной статьи существенно отличаются от АС, включенных в системы машинного перевода, системы автоматического реферирования, информационного поиска и т. д. Чаще всего они являются компьютерными версиями хорошо известных обычных словарей. Так, на рынке программного обеспечения имеются компьютерные аналоги толковых словарей английского языка (автоматический Вебстер, автоматический толковый словарь английского языка издательства «Коллинз», автоматический вариант «Нового большого англо-русского словаря»)

Автоматические словари такого типа практически повторяют структуру словарной статьи обычных словарей, однако они обладают функциями, недоступными своим прототипам. Например, многие АСКП позволяют осуществлять сортировку данных по полям словарной статьи (ср. отбор всех прилагательных), проводить автоматический поиск всех вокабул, имеющих в толковании определенный семантический компонент и т. д.

Автоматические словари для программ обработки текста можно назвать автоматическими словарями в точном смысле. Они, как правило, не предназначены для обычного пользователя. Особенности их структуры, сфера охвата словарного материала задаются теми программами, которые с ними взаимодействуют. Так, количество зон словарной статьи такого словаря может варьировать от одной до сотни. Чрезвычайно разнообразны и области лексикографического описания. Это может быть синтаксический словарь, семантический словарь, словарь морфем, псевдооснов, словарь устойчивых словосочетаний и т.д. АС, используемые в системах информационного поиска, имеют вид тезаурусов, а АС систем машинного перевода включают подробную информацию о морфологических, синтаксических и семантических особенностях функционирования слова.

Наиболее известные автоматические переводные словари, как правило, являются многоязычными. Так, AC LEXIC содержит лексикофа-фические данные по немецкому, английскому, французскому, русскому, итальянскому, датскому и португальскому языкам

Важным типом АС являются автоматические словари конкордансов, содержащие в машинном виде примеры на употребление всех слов (словоформ), представленных в конкретном произведении или в творческом наследии писателя.


 

А также другие работы, которые могут Вас заинтересовать

37764. Безпека SMTP і спам 760.04 KB
  У результаті цього спам став практично нерозв'язною проблемою так як було неможливо визначити хто насправді є відправником повідомлення фактично можна відправити лист від імені будьякої людини. DT CRLF Вказує на початок повідомлення. Для завершення повідомлення вказується CRLF . Повідомлення доставляються клієнтові за протоколом POP а надсилаються як і раніше за допомогою SMTP.
37765. Робота з діалоговими компонентами 2.09 MB
  Виконавши лабораторну роботу, я освоїв роботу програм з такими діалоговими компонентами як OpenDialog та SaveDialog для зв’язку з файлами (їх створення, збереження або відкриття вже існуючих), PrinterSetupDialog для налагодження підключених принтерів для друку, FindDialog та ReplaceDialog для пошуку та заміни тексту. Також закріпив навички роботи з компонентами середовища Delphi TMemo та TMainMenu, зрозумів основні принципи створення текстового редактора.
37766. Безопасность жизнедеятельности. Чрезвычайные ситуации мирного и военного времени, организация защиты населения 262.51 KB
  Безопасность жизнедеятельности — это область научных знаний, изучающая общие опасности, угрожающие каждому человеку, и разрабатывающая соответствующие способы защиты от них в любых условиях обитания человека.
37767. Протокол для передачі файлів FTP 189.19 KB
  Для переходу в інший каталог використовую команду CWD: CWD incoming. Для того щоб створити в цій директорії вводжу команду STOR: STOR myfile. Переходжу в інший каталог за допомогою команди CWD: cwd incoming та вводжу команду PWD яка відображає вмістиме каталогу з яким встановлений звязок:. Вводжу команду LS що відображає файли і підкаталоги в даному каталозі.
37768. Розробка складних додатків з використанням графіки 1.16 MB
  ps unit Unit1; {mode objfpc}{H} interfce uses Clsses SysUtils FileUtil LResources Forms Controls Grphics Dilogs Menus StdCtrls ExtCtrls Spin; type { TForm1 } TForm1 = clssTForm Button1: TButton; Button2: TButton; Button3: TButton; ColorDilog1: TColorDilog; MinMenu1: TMinMenu; MenuItem1: TMenuItem; MenuItem2: TMenuItem; MenuItem3: TMenuItem; MenuItem4: TMenuItem; MenuItem5: TMenuItem; MenuItem6: TMenuItem; MenuItem7: TMenuItem; MenuItem8: TMenuItem; MenuItem9:...
37770. Розробка DLL-бібліотек 4.3 MB
  Тема: Розробка DLL-бібліотек. Мета: навчитись створювати DLL-бібліотеки та використовувати їх в додатках, засвоїти навички експорту функцій.
37771. Методы защиты информации от утечки по опто виброакустическому каналу 534 KB
  УЧЕБНОЕ ПОСОБИЕ для студента по выполнению лабораторной работы № 2 по учебной дисциплине Инженернотехническая защиты информации Тема: Методы защиты информации от утечки по опто виброакустическому каналу Занятие: Исследование активных методов защиты защищаемого помещения от утечки речевой информации за счет каналов утечки речевой информации на основе волоконнооптических коммуникаций. Обсуждено на заседании кафедры ФЗИ РГГУ ____ ________ 2007 года протокол № ____ Москва 2007 Тема: Методы защиты защищаемого помещения ЗП от...
37772. УНИПОЛЯРНЫЙ ТРАНЗИСТОР В ШИРОКОПОЛОСНОМ УСИЛИТЕЛЬНОМ КАСКАДЕ С КС -СВЯЗЯМИ 141.75 KB
  От положения рабочей точки транзистора усилительного каскада зависят параметры транзистора а следовательно и параметры усилителя такие например как коэффициент усиления по напряжению ^и0 допустимая величина входного напряжения Цвхмакс превышение которой ведет к искажению выходного сигнала коэффициент полезного действия и т. Соответственно высшая граничная частота Гв полоса пропускания усилителя определяется как в = Расширить полосу пропускания усилителя в условиях...