75865

Види інформаційно-пошукових систем. Ключові слова. Пошуковий образ документу. Інформаційно-пошукова мова

Доклад

Иностранные языки, филология и лингвистика

По характеру предоставления логической организации хранимой информации ИПС разделяются на фактографические документальные и геоинформационные. В документальных единичным элементом информации является нерасчлененный на более мелкие элементы документ и информация при вводе как правило не структурируются или структурируются в ограниченном виде. Для вводимого документа могут устанавливаться некоторые формализованные позиции дата изготовления исполнитель тематика. Некоторые виды документальных информационных систем обеспечивают установление...

Украинкский

2015-01-26

27.06 KB

0 чел.

43. Види інформаційно-пошукових систем. Ключові слова. Пошуковий образ документу. Інформаційно-пошукова мова.

Понятие информационных поисковых систем.

Автоматизированная поисковая система – система, состоящая из персонала и комплекса средств автоматизации его деятельности, реализующая информационную технологию выполнения установленных функций.

Под информационной системой понимается – организованная совокупность программно – технических и других вспомогательных средств, технологических процессов и функционально – определённых групп работников, обеспечивающих сбор, представление и накопление информационных ресурсов в определённой предметной области, поиск и выдачу сведений, необходимых для удовлетворения информационных потребностей установленного контингента пользователей – абонентов системы.

По характеру предоставления логической организации хранимой информации ИПС разделяются на фактографические, документальные и геоинформационные.

Фактографические накапливают и хранят данные в виде множества экземпляров одного или нескольких типов структурных элементов. Каждый из таких экземпляров структурных элементов или некоторая их совокупность отражают сведения, по какому - либо факту, событию. Структура каждого типа информационного объекта состоит из конечного набора реквизитов, отражающих основные аспекты и характеристики сведений для объектов данной предметной области.

В документальных единичным элементом информации является нерасчлененный на более мелкие элементы документ и информация при вводе, как правило, не структурируются, или структурируются в ограниченном виде. Для вводимого документа могут устанавливаться некоторые формализованные позиции - дата изготовления, исполнитель, тематика. Некоторые виды документальных информационных систем обеспечивают установление логической взаимосвязи вводимых документов - соподчиненность по смысловому содержанию.

В геоинформационных данные организованы в виде отдельных информационных объектов привязанных к общей электронной топографической основе. Геоинформационные системы применяются для информационного обеспечения в тех предметных областях, структура информационных объектов и процессов в которых имеется географический компонент.

Другим критерием классификации поисковых систем являются функции или решаемые задачи:

Справочные являются наиболее распространенным типом функций информационных систем, и заключается в предоставлении абонентам системы возможностей получения установочных данных на определённые классы объектов.

Поисковые являются наиболее распространённым классом информационных систем. В общем, виде можно рассматривать как некое информационное пространство, задаваемое в терминах информационно - логического описания предметной области.

Расчетные заключается в обработке информации , находящейся в системе , по определённым расчётным алгоритмам для различных целей.

Термин ключевые слова далее будет относиться к словам, входящим в текст HTML документа и в предполагаемый запрос пользователя поисковой системы, ищущего информацию по тематике, совпадающей с тематикой документа.

Поисковые машины рассчитывают релевантность текста, строя частотный ряд из слов. Чем чаще слово встречается в тексте, тем большую, по отношению к запросу пользователя, релевантность оно получает.

Ключевые слова должны подбираться с учетом частоты их использования, при поиске информации. Как правило, люди используют первые пришедшие в голову слова. Именно на эти слова и нужно ориентироваться.

Чем большую релевантность имеют ключевые слова, тем большую конкурентоспособность они придают документу.

Но наиболее высокая релевантность документа запросу возникает, когда совпадают не отдельные слова, а фразы. Желательно (но не обязательно), чтобы в ключевые фразы входили только ключевые слова.

В качестве ключевых нужно выбирать фразы, которые с большой вероятностью могут быть использованы потенциальной аудиторией при поиске информации.

При работе с ключевыми фразами объем потенциальной аудитории также зависит от размера фразы.

Чем на более длинную фразу заряжен документ, тем ниже уровень конкуренции, но и размер аудитории меньше. Ориентироваться на фразу более чем из 4 слов не имеет смысла - слишком мало шансов, что ее кто-нибудь наберет.

Нужно выбирать ключевые слова так, чтобы при запросе поисковая машина выдавала список ресурсов (первая десятка), часть из которых по качеству (стиль, информация) уступают позиционируемому документу.

Ключевые слова образуют новый способ описания и поиска документов – язык ключевых слов (ИПЯ ключевых слов), который сливается с языком библиографических данных в единый программный комплекс с едиными процедурами поиска.

Поисковый образ документа – составляется из нескольких классификационных языков: ББК (библиотечно-библиографической классификации), ГРНТИ (государственного рубрикатора научно-технической информации), классификации Дьюи, тезауруса и словаря ключевых слов: набор ключевых слов, выбранных для оптимизации сайта. поисковый образ, выражающий основное смысловое содержание документа.

В результате индексирования содержание документа отображается в поисковый образ документа, а содержание запроса - в поисковое предписание.

Поисковый образ документа содержит:

- признаки, необходимые для поиска документа по запросу;

- идентифицирующие и другие сведения о документе: выходные данные, тип, язык и т.д.

Релевантность поискового образа документа достигается:

а) согласованностью дескрипторной строки и синтагматической цепочки;

б) соотнесенностью лингвистической семантики с логической;

в) корректным сосуществованием вербальных и символических ИПЯ.

По области или по сфере применения информационно-поисковых языков можно выделить:

1. Коммуникативные (общесистемные) ИПЯ - предназначенные для обеспечения взаимодействия между различными (информационными, библиотечными и др.) системами (в т.ч. распределенными по государственной, ведомственной или территориальной принадлежности);

2. Локальные (внутренние) ИПЯ - предназначенные для использования в рамках отдельной системы;

3. Внешние ИПЯ - используемые в других системах и предназначенные для взаимодействия только с ними.

Информационно-поисковый язык (ИПЯ) — искусственный язык, представляющий совокупность средств для описания формальной и содержательной структуры для поиска (путем индексирования) по запросу пользователя

В ИПЯ можно выделить алфавит, лексику и грамматику.

Чаще всего ИПЯ разделяются на языки-классификации и языки дескрипторного типа. Языки-классификации, или языки классификационного типа основываются на иерархических классификациях понятий. В автоматизированных ИПС чаще используются дескрипторные информационно-поисковые языки – тематика документа описывается совокупностью дескрипторов. В качестве дескрипторов выступают слова, термины, обозначающие простые, достаточно элементарные категории и понятия проблемной области.


 

А также другие работы, которые могут Вас заинтересовать

19345. СУПЕРСКАЛЯРНЫЕ ПРОЦЕССОРЫ 306.5 KB
  АК ЛЕКЦИЯ № 22 СУПЕРСКАЛЯРНЫЕ ПРОЦЕССОРЫ Суперскалярные процессоры Поскольку возможности по совершенствованию элементной базы уже практически исчерпаны дальнейшее повышение производительности ВМ лежит в плоскости архитектурных решений. Как уже отмечалось од
19346. VLIW – ПРОЦЕССОРЫ. НЕТРАДИЦИОННЫЕ АРХИТЕКТУРЫ 354 KB
  АК ЛЕКЦИЯ № 23 VLIW – ПРОЦЕССОРЫ. Нетрадиционные архитектуры Вычислительные системы с командными словами сверхбольшой длины VLIW Архитектура с командными словами сверхбольшой длины или со сверхдлинными командами VLIW Very Long Instruction Word известна с начала 80х из ряда универ...
19347. МНОГОЯДЕРНАЯ АРХИТЕКТУРА 277 KB
  АК ЛЕКЦИЯ № 24 МНОГОЯДЕРНАЯ АРХИТЕКТУРА Вычислительные системы класса MIMD Технология SIMD исторически стала осваиваться раньше что и предопределило широкое распространение SIMDсистем. В настоящее время тем не менее наметился устойчивый интерес к архитектурам класс...
19349. Проводниковые материалы 88 KB
  Лекция №2 Проводниковые материалы. Основные электрические параметры металлов Из общего курса физики известно что плотность электрического тока в веществе определяется зарядом q концентрацией n и дрейфовой средней направленной скоростью носителей заря
19350. Материалы используемые в электронных приборах 126 KB
  Лекция №1 Введение Для создания электронных приборов необходимо много различных материалов и уникальных технологических процессов. Современная радиотехника и особенно высокочастотная техника радиосвязь приборы и аппаратура радиоэлектроники требуют б...
19351. Неметаллические проводниковые материалы 27.87 KB
  Лекция №3. Неметаллические проводниковые материалы. Сверхпроводники. При понижении температуры удельное сопротивление p металлов уменьшается. Представляет большой интерес электропроводность металлов при весьма низких криогенных температурах приближающихся к...
19352. Диэлектрические материалы 49 KB
  Лекция №4 Диэлектрические материалы. Диэлектрическими называются электротехнические материалы с. большим сопротивлением прохождению тока электроизоляционными диэлектрические материалы диэлектрики предназначенные для изоляции электрических цепей элемент
19353. Зависимость диэлектрической проницаемости от температуры и частоты переменного электрического тока 193.5 KB
  Лекция №5 Зависимость диэлектрической проницаемости от температуры и частоты переменного электрического тока Зависимость диэлектрической проницаемости от температуры давления влажности напряжения. Характер температурной зависимости ε диэлектриков с разл...