75865

Види інформаційно-пошукових систем. Ключові слова. Пошуковий образ документу. Інформаційно-пошукова мова

Доклад

Иностранные языки, филология и лингвистика

По характеру предоставления логической организации хранимой информации ИПС разделяются на фактографические документальные и геоинформационные. В документальных единичным элементом информации является нерасчлененный на более мелкие элементы документ и информация при вводе как правило не структурируются или структурируются в ограниченном виде. Для вводимого документа могут устанавливаться некоторые формализованные позиции дата изготовления исполнитель тематика. Некоторые виды документальных информационных систем обеспечивают установление...

Украинкский

2015-01-26

27.06 KB

0 чел.

43. Види інформаційно-пошукових систем. Ключові слова. Пошуковий образ документу. Інформаційно-пошукова мова.

Понятие информационных поисковых систем.

Автоматизированная поисковая система – система, состоящая из персонала и комплекса средств автоматизации его деятельности, реализующая информационную технологию выполнения установленных функций.

Под информационной системой понимается – организованная совокупность программно – технических и других вспомогательных средств, технологических процессов и функционально – определённых групп работников, обеспечивающих сбор, представление и накопление информационных ресурсов в определённой предметной области, поиск и выдачу сведений, необходимых для удовлетворения информационных потребностей установленного контингента пользователей – абонентов системы.

По характеру предоставления логической организации хранимой информации ИПС разделяются на фактографические, документальные и геоинформационные.

Фактографические накапливают и хранят данные в виде множества экземпляров одного или нескольких типов структурных элементов. Каждый из таких экземпляров структурных элементов или некоторая их совокупность отражают сведения, по какому - либо факту, событию. Структура каждого типа информационного объекта состоит из конечного набора реквизитов, отражающих основные аспекты и характеристики сведений для объектов данной предметной области.

В документальных единичным элементом информации является нерасчлененный на более мелкие элементы документ и информация при вводе, как правило, не структурируются, или структурируются в ограниченном виде. Для вводимого документа могут устанавливаться некоторые формализованные позиции - дата изготовления, исполнитель, тематика. Некоторые виды документальных информационных систем обеспечивают установление логической взаимосвязи вводимых документов - соподчиненность по смысловому содержанию.

В геоинформационных данные организованы в виде отдельных информационных объектов привязанных к общей электронной топографической основе. Геоинформационные системы применяются для информационного обеспечения в тех предметных областях, структура информационных объектов и процессов в которых имеется географический компонент.

Другим критерием классификации поисковых систем являются функции или решаемые задачи:

Справочные являются наиболее распространенным типом функций информационных систем, и заключается в предоставлении абонентам системы возможностей получения установочных данных на определённые классы объектов.

Поисковые являются наиболее распространённым классом информационных систем. В общем, виде можно рассматривать как некое информационное пространство, задаваемое в терминах информационно - логического описания предметной области.

Расчетные заключается в обработке информации , находящейся в системе , по определённым расчётным алгоритмам для различных целей.

Термин ключевые слова далее будет относиться к словам, входящим в текст HTML документа и в предполагаемый запрос пользователя поисковой системы, ищущего информацию по тематике, совпадающей с тематикой документа.

Поисковые машины рассчитывают релевантность текста, строя частотный ряд из слов. Чем чаще слово встречается в тексте, тем большую, по отношению к запросу пользователя, релевантность оно получает.

Ключевые слова должны подбираться с учетом частоты их использования, при поиске информации. Как правило, люди используют первые пришедшие в голову слова. Именно на эти слова и нужно ориентироваться.

Чем большую релевантность имеют ключевые слова, тем большую конкурентоспособность они придают документу.

Но наиболее высокая релевантность документа запросу возникает, когда совпадают не отдельные слова, а фразы. Желательно (но не обязательно), чтобы в ключевые фразы входили только ключевые слова.

В качестве ключевых нужно выбирать фразы, которые с большой вероятностью могут быть использованы потенциальной аудиторией при поиске информации.

При работе с ключевыми фразами объем потенциальной аудитории также зависит от размера фразы.

Чем на более длинную фразу заряжен документ, тем ниже уровень конкуренции, но и размер аудитории меньше. Ориентироваться на фразу более чем из 4 слов не имеет смысла - слишком мало шансов, что ее кто-нибудь наберет.

Нужно выбирать ключевые слова так, чтобы при запросе поисковая машина выдавала список ресурсов (первая десятка), часть из которых по качеству (стиль, информация) уступают позиционируемому документу.

Ключевые слова образуют новый способ описания и поиска документов – язык ключевых слов (ИПЯ ключевых слов), который сливается с языком библиографических данных в единый программный комплекс с едиными процедурами поиска.

Поисковый образ документа – составляется из нескольких классификационных языков: ББК (библиотечно-библиографической классификации), ГРНТИ (государственного рубрикатора научно-технической информации), классификации Дьюи, тезауруса и словаря ключевых слов: набор ключевых слов, выбранных для оптимизации сайта. поисковый образ, выражающий основное смысловое содержание документа.

В результате индексирования содержание документа отображается в поисковый образ документа, а содержание запроса - в поисковое предписание.

Поисковый образ документа содержит:

- признаки, необходимые для поиска документа по запросу;

- идентифицирующие и другие сведения о документе: выходные данные, тип, язык и т.д.

Релевантность поискового образа документа достигается:

а) согласованностью дескрипторной строки и синтагматической цепочки;

б) соотнесенностью лингвистической семантики с логической;

в) корректным сосуществованием вербальных и символических ИПЯ.

По области или по сфере применения информационно-поисковых языков можно выделить:

1. Коммуникативные (общесистемные) ИПЯ - предназначенные для обеспечения взаимодействия между различными (информационными, библиотечными и др.) системами (в т.ч. распределенными по государственной, ведомственной или территориальной принадлежности);

2. Локальные (внутренние) ИПЯ - предназначенные для использования в рамках отдельной системы;

3. Внешние ИПЯ - используемые в других системах и предназначенные для взаимодействия только с ними.

Информационно-поисковый язык (ИПЯ) — искусственный язык, представляющий совокупность средств для описания формальной и содержательной структуры для поиска (путем индексирования) по запросу пользователя

В ИПЯ можно выделить алфавит, лексику и грамматику.

Чаще всего ИПЯ разделяются на языки-классификации и языки дескрипторного типа. Языки-классификации, или языки классификационного типа основываются на иерархических классификациях понятий. В автоматизированных ИПС чаще используются дескрипторные информационно-поисковые языки – тематика документа описывается совокупностью дескрипторов. В качестве дескрипторов выступают слова, термины, обозначающие простые, достаточно элементарные категории и понятия проблемной области.


 

А также другие работы, которые могут Вас заинтересовать

3864. Управляющие операторы или принятие решений в VB6 428.5 KB
  Управляющие операторы или принятие решений в VB6. Операторы, которые могут изменить последовательность выполнения операторов процедуры. Основанием для принятия решений в управляющих операторах являются условные (логические) выражения. Логические вы...
3865. Основні поняття та закони хімії. Конспект лекцій 3.89 MB
  ВСТУП Без знання основ хімії неможливе успішне вивчення технічних і технологічних дисциплін. Метою курсу є оволодіння студентами знань, необхідних їм для розуміння хімічних та технологічних явищ, які лежать в основі перетворень процесів зварювання...
3866. Работа с листом. Выделение объектов 3.16 MB
  Работа с листом. Выделение объектов Ячейка, блок ячеек, строка, диапазон строк, столбец, диапазон столбцов, лист, книга - это основные объекты, с которыми работает пользователь Excel. Принцип робот с объектами одинаков для всех программ Windows: на...
3867. Запуск Excel. Основные понятия 830.33 KB
  Запуск Excel. Основные понятия Запустить электронную таблицу Excel можно из главного меню, пункт Программы. При частом обращении к этой программе удобно поместить ее ярлык на рабочий стол, и пользоваться им для запуска Excel. Кроме того, двойное щел...
3868. Моделирование решения уравнений в среде электронных таблиц MS Excel 74.9 KB
  Моделирование решения уравнений в среде электронных таблиц MS Excel Основная задача нашего сегодняшнего урока - это научиться решать уравнения различными методами, а также моделировать процесс решения определенного вида уравнений в зависимости от зн...
3869. Формулы в Microsoft Excel 407.37 KB
  Формулы в Microsoft Excel Общие сведения Excel - программируемый табличный калькулятор. Все расчеты в Excel выполняют формулы. Формулой Excel считает все, что начинается со знака "=". Если в ячейке написать просто "1+1", Excel не будет вычислять это...
3870. Формат представления данных в ячейках 182.39 KB
  Формат представления данных в ячейках По умолчанию после создания документа все ячейки находятся в формате "Общий". Этот формат имеет ряд хитростей: числа выравниваются по правому краю, а текст — по левому если, изменяя ширину столбца, сделать...
3871. Введение в Microsoft Excel 173.34 KB
  Введение в Microsoft Excel Microsoft Excel — одна из программ пакета Microsoft Office, представляющая из себя программируемый табличный калькулятор. Область применения Microsoft Excel Область применения Excel широка: благодаря тому, что л...
3872. Управління ризиками 57.5 KB
  Управління ризиками Основні поняття Управління ризиками розглядається на адміністративному рівні ІБ, оскільки тільки керівництво організації здатне виділити необхідні ресурси, ініціювати і контролювати виконання відповідних програм. Взагалі кажучи, ...