75880

Структурні та мовні особливості словникових статей словників-тезаурусів, двомовних, асоціативних, частотних словників

Доклад

Иностранные языки, филология и лингвистика

Идеографические словари. Словари-тезаурусы сделанные по конкретным проблемным областям например по электронике геологии торговле политике широко используются в системах автоматического поиска. Переводные словари. Франкорусские словари представлены в частности словарем К.

Украинкский

2015-01-26

48 KB

0 чел.

25. Структурні та мовні особливості словникових статей словників-тезаурусів, двомовних, асоціативних, частотних словників.

Идеографические словари. Типология словарей не ограничивается общими и частными словарями. В отличие от толковых словарей, в которых словарные статьи располагаются по алфавиту заглавного слова, в словарях-тезаурусах (иначе называемых также идеографическими словарями) лексика организуется по тематическому принципу. (Термин «тезаурус» имеет еще два значения. Одно из них – очень полный, самый полный словарь; второе же относится не к лексикографии, а к общей лингвистике, а также теории знаний и теории коммуникации: тезаурусом называется вся совокупность имеющихся у человека познаний.) В качестве словарной статьи словаря-тезауруса выступают целые таксоны – группы лексем, объединенных по близости значения. Фактически таксоны представляют собой семантические поля.

Наиболее известный из имеющихся словарей-тезаурусов, которому обязан своим существованием и сам этот термин, создан на материале английского языка; это постоянно переиздаваемый тезаурус П.М.Роже Roget"s Thesaurus of English Words and Phrases (1852). В России на тезаурусных принципах был построены второй (1907) и четвертый (1916) тома Словаря русского языка, над которыми работал А.А.Шахматов.

Несмотря на наличие такого классического образца, как тезаурус Роже, принципы построения тезаурусов во многом остаются дискуссионными. Одна из основных проблем построения тезаурусов заключается в том, что в принципе любой семантический компонент в плане содержания слова может быть основанием для создания особого таксона. Например, глагол обманывать попадает не только в очевидную тематическую рубрику «ОБМАН, ЛОЖЬ», но и в возможные таксоны «ДОСТИЖЕНИЕ ЦЕЛИ», «НЕКООПЕРАТИВНОСТЬ ПОВЕДЕНИЯ», «ЭТИЧЕСКИЕ НОРМЫ» и др. Вторая проблема связана с древесной структурой понятийных рубрик тезауруса (таксонов). Древесное представление предполагает строгую иерархию понятий. Между тем семантические связи в лексике вовсе не ограничиваются родо-видовыми отношениями. Лексические единицы могут связываться отношениями следствия, ассоциации, обоснования и др. Множественность семантических отношений между лексемами указывает на то, что в тезаурусе более предпочтительна структура семантической сети, которая, однако, существенно меняет представление о классической схеме тезауруса. При таком методологическом подходе таксоны (рубрики) тезауруса не образуют древесной структуры, а связаны между собой комплексом отсылок.

Третья проблема касается принципов формирования таксонов тезауруса. Необходима разработка общих правил, по которым одни компоненты плана содержания слова формируют таксон в словаре, а другие – нет.

При построении тезаурусов в явном виде возникает и другая нетривиальная проблема – разделение наивного и научного взгляда на мир. Некоторые тезаурусы идут по пути научной структуризации мира, при которой, например, существительное кит ни в каком виде не будет представлено в разделе «РЫБЫ», хотя понятно, что наивное сознание в том или ином виде связывает китов с миром рыб. Научная структуризация понятий представлена, например, в тематическом словаре, создаваемом в настоящее время коллективом сотрудников Института русского языка РАН под руководством Н.Ю.Шведовой. Понятно, что при таком подходе тезаурус представляет не структуру лексики, отражающей наивный взгляд на мир, а структуру научных категорий.

Наивный взгляд на мир реализуется в проекте создания Тезауруса русской идиоматики (А.Н.Баранов, Д.О.Добровольский). Так, таксон «ВРЕМЯ» включает перекрестные отсылки к полям КОЛИЧЕСТВО, ЧЕЛОВЕК (ВОЗРАСТ), ПЕРЕМЕЩЕНИЕ (БЫСТРОЕ VS. МЕДЛЕННОЕ).

Словари-тезаурусы, сделанные по конкретным проблемным областям (например, по электронике, геологии, торговле, политике), широко используются в системах автоматического поиска. Информационно-поисковые тезаурусы образуют основу информационных языков, с помощью которых кодируются документы в информационной системе.

Переводные словари. Широкое поле работы для лексикографов образует создание двуязычных, или переводных словарей, практическую значимость и распространенность которых трудно переоценить. Основная задача словарей этого типа заключается в обеспечении понимания текста на иностранном языке, его перевода на родной язык. Несколько более сложной оказывается обратная задача – перевод текста на родном языке на иностранный язык. Российская лексикография (как и лексикография большинства развитых стран, активно участвующих в различных формах международного обмена) имеет богатую традицию составления двуязычных словарей. Среди англо-русских словарей наиболее известны два. Это Англо-русский словарь В.К.Мюллера, первое издание которого вышло в 1943; впоследствии словарь дважды перерабатывался, и последнее, 24-е его издание увидело свет в 1993. Затем он был радикально переработан коллективом под руководством Е.Б.Черкасской и выдержал уже несколько изданий под названием Новый англо-русский словарь. Более полным по словнику является Большой англо-русский словарь в 2-х томах под ред. И.Р.Гальперина; его третье издание 1979 содержит около 150 тыс. словарных статей. Впоследствии было издано дополнение к этому словарю, а затем он был сильно переработан и значительно расширен, результатом чего стало появление в 1993 Нового большого англо-русского словаря под ред. Ю.Д.Апресяна, содержащего около 250 тыс. словарных статей. Франко-русские словари представлены, в частности, словарем К.А.Ганшиной (шестое издание в 1977). Большие по размеру словника и лексикографически хорошо проработанные иностранно-русские словари имеются для немецкого, итальянского, испанского, польского, латинского, шведского, китайского, японского и некоторых других языков, включая языки народов России и бывшего СССР (например, бурятского). С русско-иностранными словарями дело обстоит несколько хуже; так, русско-английского словаря, сравнимого по своим достоинствам с лучшими англо-русскими словарями, до сих пор не существует.

Переводными словарями особого типа являются также и упомянутые выше лингвострановедческие словари. Кроме того, переводы слов, образующих заглавия словарных статей, на один или несколько языков могут включаться в лингвистические словари почти всех существующих разновидностей.

Ассоциативные словари. Как показывают семантические и психолингвистические исследования, сфера ассоциативных отношений в лексике образует особую и достаточно устойчивую систему, которая становится объектом описания в ассоциативных словарях. Статья такого словаря представляет собой лексему-стимул, которой сопоставляется список упорядоченных по частоте или по алфавиту (с указанием частоты) слов – реакций, полученных в психолингвистическом эксперименте. В 1999 в Институте русского языка РАН был завершен проект Ассоциативного тезауруса современного русского языка (Ю.Н.Караулов, Е.Ф.Тарасов, Ю.А.Сорокин, Н.В.Уфимцева, Г.А.Черкасова), по результатам которого опубликовано три части (шесть книг) нового ассоциативного словаря.

Частотные словари. Словарный формат описания приложим не только к области значений слов, но и к другим сторонам функционирования лексической системы. В частотных словарях указывается частота употребления слов в специально сформированной представительной выборке текстов. Для русского языка наиболее известны Частотный словарь русского языка Л.Н.Засориной (1977) и Частотный словарь современного русского литературного языка Э.А.Штейнфельдт (1963); первый же по времени частотный словарь русского языка Г.Г.Йосельсона был издан в 1953 в США. Наиболее объемный (около 40 тыс. слов) словарь Засориной составлен на основе обработки примерно одного миллиона словоупотреблений. Частотные словари широко используются в сфере прикладной лингвистики. Данные о частотности употребления необходимы, например, при установлении авторства текста. Важны данные о наиболее частотных словах и при разработке компьютерных программ проверки орфографии.


 

А также другие работы, которые могут Вас заинтересовать

75516. Общие сведения об ИС «1С: Предприятие» 25.5 KB
  Общие сведения об ИС 1С: Предприятие В последнее время наиболее широкое распространение получили системы автоматизированного бухгалтерского учёта одной из которых является система 1С: Предприятие. Ее преимуществами являются постпродажное обслуживание широкая сеть партнерских внедренческих фирм открытая архитектура возможность гибкой настройки и доработки системы силами самого предприятия или сторонних внедренческих фирм. В основу системы 1С: Предприятие 7.5 которые поддерживаются в Любом варианте поставки системы общие для...
75517. Характеристика типовой конфигурации 21.5 KB
  При отражении основных хозяйственных операций по различным разделам учета а также при вводе регламентных операций в конце месяца в типовой конфигурации происходит автоматическое формирование бухгалтерских проводок. Кроме того она поставляется с набором типовых операций полностью настроенных и готовых к применению.
75518. Конфигуратор ИС «1С: Предприятие» 100 KB
  Созданная конфигурация используется системой для реализации программного окружения для выполнения необходимых учетных задач. Работа по созданию конфигурации задачи выполняется в окне Конфигурация рис. Автоматически проверка на несохраненную информацию выполняется также при закрытии окна Конфигурация или при выходе из Конфигуратора. Конфигурация задачи сохраняется на диске в каталоге с базой данных определяется параметром D в командной строке запуска 1С:Конфигуратор в файле с именем 1CV7.
75519. Предметно-ориентированные ЭИС, основные понятия 29 KB
  Предметно-ориентированные информационные системы раскрываются организационно-методологические основы построения и функционирования экономических информационных систем. Рассматриваются возможности создания и использования бухгалтерских...
75520. Понятие базы данных, основные определения и понятия 29 KB
  База данных БД именованная совокупность данных отражающая состояние объектов и их отношений в рассматриваемой предметной области. Система управления базами данных СУБД совокупность языковых и программных средств предназначенных для создания ведения и совместного использования БД многими пользователями. Основными понятиями реляционных баз данных являются тип данных домен атрибут кортеж первичный ключ и отношение.
75521. Особенности построения базы данных, банка данных и СУБД 24 KB
  Современные авторы часто употребляют термины «банк данных» и «база данных» как синонимы, однако в общеотраслевых руководящих материалах по созданию банков данных Государственного комитета по науке и технике...
75522. Трехуровневая модель СУБД предложенная организацией ANSI 114.5 KB
  Трехуровневая модель СУБД предложенная организацией NSI Система управления базами данных СУБД совокупность языковых и программных средств предназначенных для создания ведения и совместного использования БД многими пользователями. Трехуровневая модель системы управления базой данных предложенная АN5I Уровень внешних моделей самый верхний уровень где каждая модель имеет свое видение данных. Концептуальный уровень центральное управляющее звено здесь база данных представлена в наиболее общем виде который объединяет данные...
75523. ИС Project Expert, назначение и основные принципы работы 27 KB
  ИС Project Expert назначение и основные принципы работы В своей деятельности руководитель предприятия постоянно сталкивается с необходимостью определения текущего и будущего положения предприятия на рынке подготовки плана развития оценки возможных альтернатив анализа эффективности принимаемых решений. Процесс планирования развития предприятия в условиях рынка требует применения современных методик и инструментов снижающих временные затраты. В зарубежной литературе имитационные модели описывающие деятельность предприятия в условиях рынка...
75524. Концептуальная модель ИС 1С: Предприятие 23 KB
  Концептуальная модель ИС 1С: Предприятие В основе ИС оперативного анализа данных лежит многомерное концептуальное представление суть которого в выделении из общего объёма информации собственно анализируемых данных фактов и вспомогательных данных измерений. Сюда относятся способы построения структур данных типы связей между данными принципы манипулирования ими формы описания бизнеслогики способы связи данных с интерфейсными объектами разделение функциональности по уровням системы и многое другое. Вся разработка ведется в рамках одной...