75865

Види інформаційно-пошукових систем. Ключові слова. Пошуковий образ документу. Інформаційно-пошукова мова

Доклад

Иностранные языки, филология и лингвистика

По характеру предоставления логической организации хранимой информации ИПС разделяются на фактографические документальные и геоинформационные. В документальных единичным элементом информации является нерасчлененный на более мелкие элементы документ и информация при вводе как правило не структурируются или структурируются в ограниченном виде. Для вводимого документа могут устанавливаться некоторые формализованные позиции дата изготовления исполнитель тематика. Некоторые виды документальных информационных систем обеспечивают установление...

Украинкский

2015-01-26

27.06 KB

0 чел.

43. Види інформаційно-пошукових систем. Ключові слова. Пошуковий образ документу. Інформаційно-пошукова мова.

Понятие информационных поисковых систем.

Автоматизированная поисковая система – система, состоящая из персонала и комплекса средств автоматизации его деятельности, реализующая информационную технологию выполнения установленных функций.

Под информационной системой понимается – организованная совокупность программно – технических и других вспомогательных средств, технологических процессов и функционально – определённых групп работников, обеспечивающих сбор, представление и накопление информационных ресурсов в определённой предметной области, поиск и выдачу сведений, необходимых для удовлетворения информационных потребностей установленного контингента пользователей – абонентов системы.

По характеру предоставления логической организации хранимой информации ИПС разделяются на фактографические, документальные и геоинформационные.

Фактографические накапливают и хранят данные в виде множества экземпляров одного или нескольких типов структурных элементов. Каждый из таких экземпляров структурных элементов или некоторая их совокупность отражают сведения, по какому - либо факту, событию. Структура каждого типа информационного объекта состоит из конечного набора реквизитов, отражающих основные аспекты и характеристики сведений для объектов данной предметной области.

В документальных единичным элементом информации является нерасчлененный на более мелкие элементы документ и информация при вводе, как правило, не структурируются, или структурируются в ограниченном виде. Для вводимого документа могут устанавливаться некоторые формализованные позиции - дата изготовления, исполнитель, тематика. Некоторые виды документальных информационных систем обеспечивают установление логической взаимосвязи вводимых документов - соподчиненность по смысловому содержанию.

В геоинформационных данные организованы в виде отдельных информационных объектов привязанных к общей электронной топографической основе. Геоинформационные системы применяются для информационного обеспечения в тех предметных областях, структура информационных объектов и процессов в которых имеется географический компонент.

Другим критерием классификации поисковых систем являются функции или решаемые задачи:

Справочные являются наиболее распространенным типом функций информационных систем, и заключается в предоставлении абонентам системы возможностей получения установочных данных на определённые классы объектов.

Поисковые являются наиболее распространённым классом информационных систем. В общем, виде можно рассматривать как некое информационное пространство, задаваемое в терминах информационно - логического описания предметной области.

Расчетные заключается в обработке информации , находящейся в системе , по определённым расчётным алгоритмам для различных целей.

Термин ключевые слова далее будет относиться к словам, входящим в текст HTML документа и в предполагаемый запрос пользователя поисковой системы, ищущего информацию по тематике, совпадающей с тематикой документа.

Поисковые машины рассчитывают релевантность текста, строя частотный ряд из слов. Чем чаще слово встречается в тексте, тем большую, по отношению к запросу пользователя, релевантность оно получает.

Ключевые слова должны подбираться с учетом частоты их использования, при поиске информации. Как правило, люди используют первые пришедшие в голову слова. Именно на эти слова и нужно ориентироваться.

Чем большую релевантность имеют ключевые слова, тем большую конкурентоспособность они придают документу.

Но наиболее высокая релевантность документа запросу возникает, когда совпадают не отдельные слова, а фразы. Желательно (но не обязательно), чтобы в ключевые фразы входили только ключевые слова.

В качестве ключевых нужно выбирать фразы, которые с большой вероятностью могут быть использованы потенциальной аудиторией при поиске информации.

При работе с ключевыми фразами объем потенциальной аудитории также зависит от размера фразы.

Чем на более длинную фразу заряжен документ, тем ниже уровень конкуренции, но и размер аудитории меньше. Ориентироваться на фразу более чем из 4 слов не имеет смысла - слишком мало шансов, что ее кто-нибудь наберет.

Нужно выбирать ключевые слова так, чтобы при запросе поисковая машина выдавала список ресурсов (первая десятка), часть из которых по качеству (стиль, информация) уступают позиционируемому документу.

Ключевые слова образуют новый способ описания и поиска документов – язык ключевых слов (ИПЯ ключевых слов), который сливается с языком библиографических данных в единый программный комплекс с едиными процедурами поиска.

Поисковый образ документа – составляется из нескольких классификационных языков: ББК (библиотечно-библиографической классификации), ГРНТИ (государственного рубрикатора научно-технической информации), классификации Дьюи, тезауруса и словаря ключевых слов: набор ключевых слов, выбранных для оптимизации сайта. поисковый образ, выражающий основное смысловое содержание документа.

В результате индексирования содержание документа отображается в поисковый образ документа, а содержание запроса - в поисковое предписание.

Поисковый образ документа содержит:

- признаки, необходимые для поиска документа по запросу;

- идентифицирующие и другие сведения о документе: выходные данные, тип, язык и т.д.

Релевантность поискового образа документа достигается:

а) согласованностью дескрипторной строки и синтагматической цепочки;

б) соотнесенностью лингвистической семантики с логической;

в) корректным сосуществованием вербальных и символических ИПЯ.

По области или по сфере применения информационно-поисковых языков можно выделить:

1. Коммуникативные (общесистемные) ИПЯ - предназначенные для обеспечения взаимодействия между различными (информационными, библиотечными и др.) системами (в т.ч. распределенными по государственной, ведомственной или территориальной принадлежности);

2. Локальные (внутренние) ИПЯ - предназначенные для использования в рамках отдельной системы;

3. Внешние ИПЯ - используемые в других системах и предназначенные для взаимодействия только с ними.

Информационно-поисковый язык (ИПЯ) — искусственный язык, представляющий совокупность средств для описания формальной и содержательной структуры для поиска (путем индексирования) по запросу пользователя

В ИПЯ можно выделить алфавит, лексику и грамматику.

Чаще всего ИПЯ разделяются на языки-классификации и языки дескрипторного типа. Языки-классификации, или языки классификационного типа основываются на иерархических классификациях понятий. В автоматизированных ИПС чаще используются дескрипторные информационно-поисковые языки – тематика документа описывается совокупностью дескрипторов. В качестве дескрипторов выступают слова, термины, обозначающие простые, достаточно элементарные категории и понятия проблемной области.


 

А также другие работы, которые могут Вас заинтересовать

61134. ПИСЬМОВИЙ ТВІР-ОПИС ПАМ’ЯТКИ ІСТОРІЇ ТА КУЛЬТУРИ НА ОСНОВІ ОСОБИСТИХ СПОСТЕРЕЖЕНЬ І ВРАЖЕНЬ У ХУДОЖНЬОМУ СТИЛІ 40.5 KB
  Робота з текстами підготовча робота до складання творуопису пам’ятки історії та культури Прочитати висловлювання. Ще здається недавно рипіли гарби повз нього зі снопами клекотіла революція на цьому майдані соборному дзвони калатали на сполох кликали...
61135. Давній Китай 64.5 KB
  Після цього уроку учні зможуть: називати час виникнення цивілізації в Китаї появи могутньої держави в Китаї за Цінь Шіхуанді найвідоміших правителів Китаю особливості природних умов Китаю характерні риси господарського Китаю...
61137. ВИДИ ОБСТАВИН. ПОРІВНЯЛЬНИЙ ЗВОРОТ 493.85 KB
  Мета: поглибити знання учнів про обставину як другорядний член речення, порівняльний зворот, його роль у текстах різної стильової належності; сформувати вміння визначати види обставин; розвити пунктуаційні вміння виділяти порівняльні звороти комами на письмі...
61138. Релігія та культура Давнього Китаю 53 KB
  Мета: ознайомити учнів із релігійними віруваннями та культурною спадщиною Давнього Китаю; удосконалити навички інтерактивного вивчення нового матеріалу; показати неповторність і унікальність китайської культури.
61139. УЗАГАЛЬНЕННЯ Й СИСТЕМАТИЗАЦІЯ З ТЕМИ «ДРУГОРЯДНІ ЧЛЕНИ РЕЧЕННЯ» 82.5 KB
  Текст риторичний аспект: удосконалення будови і зв’язності розповідного й описового тексту використовуючи другорядні члени речення. Яким членом речення виступає порівняльний зворот.
61140. КОНТРОЛЬНЕ ЧИТАННЯ МОВЧКИ ТЕКСТУ ПУБЛІЦИСТИЧНОГО СТИЛЮ 82 KB
  Мета: оцінити рівень навчальних досягнень восьмикласників з розділу «Другорядні члени речення»; з’ясувати можливі недоліки в ході опанування мовною теорією...
61141. Цивільне право 2.48 MB
  Мета: ознайомити учнів зі структурою й джерелами цивільного права, розкрити роль цієї галузі у системі права України; розвивати навички учнів аналізувати поняття, працювати з нормативно-правовими актами...
61142. ОЗНАЧЕНО-ОСОБОВІ РЕЧЕННЯ 292.66 KB
  Формувати в учнів поняття про односкладні речення, їх види; ознайомити з означено-особовим реченням, способами вираження в ньому головного члена; розвивати вміння аналізувати ці речення у висловлюваннях