75865

Види інформаційно-пошукових систем. Ключові слова. Пошуковий образ документу. Інформаційно-пошукова мова

Доклад

Иностранные языки, филология и лингвистика

По характеру предоставления логической организации хранимой информации ИПС разделяются на фактографические документальные и геоинформационные. В документальных единичным элементом информации является нерасчлененный на более мелкие элементы документ и информация при вводе как правило не структурируются или структурируются в ограниченном виде. Для вводимого документа могут устанавливаться некоторые формализованные позиции дата изготовления исполнитель тематика. Некоторые виды документальных информационных систем обеспечивают установление...

Украинкский

2015-01-26

27.06 KB

0 чел.

43. Види інформаційно-пошукових систем. Ключові слова. Пошуковий образ документу. Інформаційно-пошукова мова.

Понятие информационных поисковых систем.

Автоматизированная поисковая система – система, состоящая из персонала и комплекса средств автоматизации его деятельности, реализующая информационную технологию выполнения установленных функций.

Под информационной системой понимается – организованная совокупность программно – технических и других вспомогательных средств, технологических процессов и функционально – определённых групп работников, обеспечивающих сбор, представление и накопление информационных ресурсов в определённой предметной области, поиск и выдачу сведений, необходимых для удовлетворения информационных потребностей установленного контингента пользователей – абонентов системы.

По характеру предоставления логической организации хранимой информации ИПС разделяются на фактографические, документальные и геоинформационные.

Фактографические накапливают и хранят данные в виде множества экземпляров одного или нескольких типов структурных элементов. Каждый из таких экземпляров структурных элементов или некоторая их совокупность отражают сведения, по какому - либо факту, событию. Структура каждого типа информационного объекта состоит из конечного набора реквизитов, отражающих основные аспекты и характеристики сведений для объектов данной предметной области.

В документальных единичным элементом информации является нерасчлененный на более мелкие элементы документ и информация при вводе, как правило, не структурируются, или структурируются в ограниченном виде. Для вводимого документа могут устанавливаться некоторые формализованные позиции - дата изготовления, исполнитель, тематика. Некоторые виды документальных информационных систем обеспечивают установление логической взаимосвязи вводимых документов - соподчиненность по смысловому содержанию.

В геоинформационных данные организованы в виде отдельных информационных объектов привязанных к общей электронной топографической основе. Геоинформационные системы применяются для информационного обеспечения в тех предметных областях, структура информационных объектов и процессов в которых имеется географический компонент.

Другим критерием классификации поисковых систем являются функции или решаемые задачи:

Справочные являются наиболее распространенным типом функций информационных систем, и заключается в предоставлении абонентам системы возможностей получения установочных данных на определённые классы объектов.

Поисковые являются наиболее распространённым классом информационных систем. В общем, виде можно рассматривать как некое информационное пространство, задаваемое в терминах информационно - логического описания предметной области.

Расчетные заключается в обработке информации , находящейся в системе , по определённым расчётным алгоритмам для различных целей.

Термин ключевые слова далее будет относиться к словам, входящим в текст HTML документа и в предполагаемый запрос пользователя поисковой системы, ищущего информацию по тематике, совпадающей с тематикой документа.

Поисковые машины рассчитывают релевантность текста, строя частотный ряд из слов. Чем чаще слово встречается в тексте, тем большую, по отношению к запросу пользователя, релевантность оно получает.

Ключевые слова должны подбираться с учетом частоты их использования, при поиске информации. Как правило, люди используют первые пришедшие в голову слова. Именно на эти слова и нужно ориентироваться.

Чем большую релевантность имеют ключевые слова, тем большую конкурентоспособность они придают документу.

Но наиболее высокая релевантность документа запросу возникает, когда совпадают не отдельные слова, а фразы. Желательно (но не обязательно), чтобы в ключевые фразы входили только ключевые слова.

В качестве ключевых нужно выбирать фразы, которые с большой вероятностью могут быть использованы потенциальной аудиторией при поиске информации.

При работе с ключевыми фразами объем потенциальной аудитории также зависит от размера фразы.

Чем на более длинную фразу заряжен документ, тем ниже уровень конкуренции, но и размер аудитории меньше. Ориентироваться на фразу более чем из 4 слов не имеет смысла - слишком мало шансов, что ее кто-нибудь наберет.

Нужно выбирать ключевые слова так, чтобы при запросе поисковая машина выдавала список ресурсов (первая десятка), часть из которых по качеству (стиль, информация) уступают позиционируемому документу.

Ключевые слова образуют новый способ описания и поиска документов – язык ключевых слов (ИПЯ ключевых слов), который сливается с языком библиографических данных в единый программный комплекс с едиными процедурами поиска.

Поисковый образ документа – составляется из нескольких классификационных языков: ББК (библиотечно-библиографической классификации), ГРНТИ (государственного рубрикатора научно-технической информации), классификации Дьюи, тезауруса и словаря ключевых слов: набор ключевых слов, выбранных для оптимизации сайта. поисковый образ, выражающий основное смысловое содержание документа.

В результате индексирования содержание документа отображается в поисковый образ документа, а содержание запроса - в поисковое предписание.

Поисковый образ документа содержит:

- признаки, необходимые для поиска документа по запросу;

- идентифицирующие и другие сведения о документе: выходные данные, тип, язык и т.д.

Релевантность поискового образа документа достигается:

а) согласованностью дескрипторной строки и синтагматической цепочки;

б) соотнесенностью лингвистической семантики с логической;

в) корректным сосуществованием вербальных и символических ИПЯ.

По области или по сфере применения информационно-поисковых языков можно выделить:

1. Коммуникативные (общесистемные) ИПЯ - предназначенные для обеспечения взаимодействия между различными (информационными, библиотечными и др.) системами (в т.ч. распределенными по государственной, ведомственной или территориальной принадлежности);

2. Локальные (внутренние) ИПЯ - предназначенные для использования в рамках отдельной системы;

3. Внешние ИПЯ - используемые в других системах и предназначенные для взаимодействия только с ними.

Информационно-поисковый язык (ИПЯ) — искусственный язык, представляющий совокупность средств для описания формальной и содержательной структуры для поиска (путем индексирования) по запросу пользователя

В ИПЯ можно выделить алфавит, лексику и грамматику.

Чаще всего ИПЯ разделяются на языки-классификации и языки дескрипторного типа. Языки-классификации, или языки классификационного типа основываются на иерархических классификациях понятий. В автоматизированных ИПС чаще используются дескрипторные информационно-поисковые языки – тематика документа описывается совокупностью дескрипторов. В качестве дескрипторов выступают слова, термины, обозначающие простые, достаточно элементарные категории и понятия проблемной области.


 

А также другие работы, которые могут Вас заинтересовать

32700. ПРОТИВОМАЛЯРИЙНЫЕ СРЕДСТВА 106 KB
  Возбудитель: малярийный плазмодий который имеет два цикла развития → бесполый шизогония в организме человека полый спорогония в теле комара СХЕМА: Противомалярийные средства отличаются по химическому строению и по влиянию на различные формы плазмодиев. Комар Зигота ♂ ♀ созревание Спорозойды...
32701. Планирование экономических показателей работы зоны ТР 318.5 KB
  Соответствие развития транспорта общим направлениям социально – экономического развития страны, что необходимо для своевременного удовлетворения спроса на перевозки пассажиров и грузов; опережающее развитие транспортной отрасли по сравнению с другими отраслями экономики, что позволит смягчить ограничения, накладываемые транспортом на производство, сферу обращения и социальную сферу...
32702. Системы учета затрат в управленческом учете на примере ОАО РГИЛК «Агролизинг» 334.5 KB
  Рассмотреть и изучить основные системы учета затрат, основные преимущества и недостатки данных систем, исследовать классификацию затрат для определения себестоимости, оценки стоимости запасов и полученной прибыли, рассмотреть перспективы развития системы учета затрат
32703. Виявлення інноваційних технологій при виробництві солодких соусів на підприємствах України 470.5 KB
  Тема інноваційні технології солодких соусів сьогодні є актуальною. Серед продукції ресторанного господарства окремий сегмент складають соуси, які сприяють кращому засвоєнню харчових нутрієнтів організмом людини, розширюють асортимент і підвищують харчову цінність страв.
32704. ВЯЖУЩИЕ СРЕДСТВА 65.5 KB
  ВЯЖУЩИЕ СРЕДСТВА Данные вещества вызывают обратимое осаждение коагуляцию белков с образованием плотных альбуминатов. Вяжущие средства ВС наносят на слизистые оболочки или раневую поверхность. Вяжущие средства Органические Неорганические растит.
32705. СТРОЕНИЕ И ФУНКЦИИ ЭФФЕРЕНТНОЙ НЕРВНОЙ СИСТЕМЫ 145 KB
  Открываются N – каналы и N устремляется внутрь клетки по градиенту концентрации деполяризация мембраны; возникает потенциал действия; К выходит. Прямого типа действия Непосредственно взаимодействуют с постсинаптическими рецепторами вызывая их стимуляцию М1Н – ХМ АцетилхолиноСl Карбахолин МХМ Пилокарпина г хлорид Ацеклидин НХМ Цитизин Цититон Лобелин 2. Непрямого типа действия антихолинэстеразные средства 2.1 МНХМ обратимого действия Физостигмин Неостигмин прозерин Пиридостигмин калимин Дистигмин убретид Амбеноний...
32706. Теория перевода японского языка 318 KB
  Проанализировать семантический и прагматический потенциал пословиц и поговорок, выявить и описать особенности функционирования пословиц и поговорок в японской периодической печати. Изучение пословиц и поговорок в прагматическом аспекте предполагает рассмотрение не только сугубо функциональных особенностей данных выражений
32707. Адреномиметики 127 KB
  действие на 12 и 12 – АР  эффекты СНС сердце:  ЧСС  СВ проводимостьО2. сосуды: суммарно АД  действие двухфазное т. Оказывает более сильное сосудосуживающее действие. Оказывает очень слабое действие на сердце бронхи кишечник обмен веществ.
32708. Антиадренергические средства 85.5 KB
  ПК: 1 гипертонический криз 2 феохромоцитома диагностика лечение характеризуется периодическими гипертоническими кризами 3 нарушение периферического кровообращения эндартерит болезнь Рейно начальные стадии атеросклеротической гангрены 4 острая сердечная недостаточность с застоем в легких 5 лечение вялозаживающих ран трофических язв пролежней отморожений ПбД: головокружение слабость набухание слизистой оболочки носа покраснение и зуд кожи; тошнота понос тахикардия. ПК: различные нарушения мозгового кровообращения ...