75865

Види інформаційно-пошукових систем. Ключові слова. Пошуковий образ документу. Інформаційно-пошукова мова

Доклад

Иностранные языки, филология и лингвистика

По характеру предоставления логической организации хранимой информации ИПС разделяются на фактографические документальные и геоинформационные. В документальных единичным элементом информации является нерасчлененный на более мелкие элементы документ и информация при вводе как правило не структурируются или структурируются в ограниченном виде. Для вводимого документа могут устанавливаться некоторые формализованные позиции дата изготовления исполнитель тематика. Некоторые виды документальных информационных систем обеспечивают установление...

Украинкский

2015-01-26

27.06 KB

0 чел.

43. Види інформаційно-пошукових систем. Ключові слова. Пошуковий образ документу. Інформаційно-пошукова мова.

Понятие информационных поисковых систем.

Автоматизированная поисковая система – система, состоящая из персонала и комплекса средств автоматизации его деятельности, реализующая информационную технологию выполнения установленных функций.

Под информационной системой понимается – организованная совокупность программно – технических и других вспомогательных средств, технологических процессов и функционально – определённых групп работников, обеспечивающих сбор, представление и накопление информационных ресурсов в определённой предметной области, поиск и выдачу сведений, необходимых для удовлетворения информационных потребностей установленного контингента пользователей – абонентов системы.

По характеру предоставления логической организации хранимой информации ИПС разделяются на фактографические, документальные и геоинформационные.

Фактографические накапливают и хранят данные в виде множества экземпляров одного или нескольких типов структурных элементов. Каждый из таких экземпляров структурных элементов или некоторая их совокупность отражают сведения, по какому - либо факту, событию. Структура каждого типа информационного объекта состоит из конечного набора реквизитов, отражающих основные аспекты и характеристики сведений для объектов данной предметной области.

В документальных единичным элементом информации является нерасчлененный на более мелкие элементы документ и информация при вводе, как правило, не структурируются, или структурируются в ограниченном виде. Для вводимого документа могут устанавливаться некоторые формализованные позиции - дата изготовления, исполнитель, тематика. Некоторые виды документальных информационных систем обеспечивают установление логической взаимосвязи вводимых документов - соподчиненность по смысловому содержанию.

В геоинформационных данные организованы в виде отдельных информационных объектов привязанных к общей электронной топографической основе. Геоинформационные системы применяются для информационного обеспечения в тех предметных областях, структура информационных объектов и процессов в которых имеется географический компонент.

Другим критерием классификации поисковых систем являются функции или решаемые задачи:

Справочные являются наиболее распространенным типом функций информационных систем, и заключается в предоставлении абонентам системы возможностей получения установочных данных на определённые классы объектов.

Поисковые являются наиболее распространённым классом информационных систем. В общем, виде можно рассматривать как некое информационное пространство, задаваемое в терминах информационно - логического описания предметной области.

Расчетные заключается в обработке информации , находящейся в системе , по определённым расчётным алгоритмам для различных целей.

Термин ключевые слова далее будет относиться к словам, входящим в текст HTML документа и в предполагаемый запрос пользователя поисковой системы, ищущего информацию по тематике, совпадающей с тематикой документа.

Поисковые машины рассчитывают релевантность текста, строя частотный ряд из слов. Чем чаще слово встречается в тексте, тем большую, по отношению к запросу пользователя, релевантность оно получает.

Ключевые слова должны подбираться с учетом частоты их использования, при поиске информации. Как правило, люди используют первые пришедшие в голову слова. Именно на эти слова и нужно ориентироваться.

Чем большую релевантность имеют ключевые слова, тем большую конкурентоспособность они придают документу.

Но наиболее высокая релевантность документа запросу возникает, когда совпадают не отдельные слова, а фразы. Желательно (но не обязательно), чтобы в ключевые фразы входили только ключевые слова.

В качестве ключевых нужно выбирать фразы, которые с большой вероятностью могут быть использованы потенциальной аудиторией при поиске информации.

При работе с ключевыми фразами объем потенциальной аудитории также зависит от размера фразы.

Чем на более длинную фразу заряжен документ, тем ниже уровень конкуренции, но и размер аудитории меньше. Ориентироваться на фразу более чем из 4 слов не имеет смысла - слишком мало шансов, что ее кто-нибудь наберет.

Нужно выбирать ключевые слова так, чтобы при запросе поисковая машина выдавала список ресурсов (первая десятка), часть из которых по качеству (стиль, информация) уступают позиционируемому документу.

Ключевые слова образуют новый способ описания и поиска документов – язык ключевых слов (ИПЯ ключевых слов), который сливается с языком библиографических данных в единый программный комплекс с едиными процедурами поиска.

Поисковый образ документа – составляется из нескольких классификационных языков: ББК (библиотечно-библиографической классификации), ГРНТИ (государственного рубрикатора научно-технической информации), классификации Дьюи, тезауруса и словаря ключевых слов: набор ключевых слов, выбранных для оптимизации сайта. поисковый образ, выражающий основное смысловое содержание документа.

В результате индексирования содержание документа отображается в поисковый образ документа, а содержание запроса - в поисковое предписание.

Поисковый образ документа содержит:

- признаки, необходимые для поиска документа по запросу;

- идентифицирующие и другие сведения о документе: выходные данные, тип, язык и т.д.

Релевантность поискового образа документа достигается:

а) согласованностью дескрипторной строки и синтагматической цепочки;

б) соотнесенностью лингвистической семантики с логической;

в) корректным сосуществованием вербальных и символических ИПЯ.

По области или по сфере применения информационно-поисковых языков можно выделить:

1. Коммуникативные (общесистемные) ИПЯ - предназначенные для обеспечения взаимодействия между различными (информационными, библиотечными и др.) системами (в т.ч. распределенными по государственной, ведомственной или территориальной принадлежности);

2. Локальные (внутренние) ИПЯ - предназначенные для использования в рамках отдельной системы;

3. Внешние ИПЯ - используемые в других системах и предназначенные для взаимодействия только с ними.

Информационно-поисковый язык (ИПЯ) — искусственный язык, представляющий совокупность средств для описания формальной и содержательной структуры для поиска (путем индексирования) по запросу пользователя

В ИПЯ можно выделить алфавит, лексику и грамматику.

Чаще всего ИПЯ разделяются на языки-классификации и языки дескрипторного типа. Языки-классификации, или языки классификационного типа основываются на иерархических классификациях понятий. В автоматизированных ИПС чаще используются дескрипторные информационно-поисковые языки – тематика документа описывается совокупностью дескрипторов. В качестве дескрипторов выступают слова, термины, обозначающие простые, достаточно элементарные категории и понятия проблемной области.


 

А также другие работы, которые могут Вас заинтересовать

46956. Особенности экономического развития Англии конца XIX – начала XX в 39 KB
  Главными особенностями экономического развития Англии конца XIX начала XX в. стали: утрата промышленного первенства и господства на мировом рынке; рост капиталистических монополий особенно колониальных и военнопромышленных; создание мощных банков и финансовой олигархии; возрастание роли экспорта капитала в том числе в пределы Британской империи колонии и в зависимые страны; превращение колониальной монополии в решающий фактор экономического и политического положения Англии во всемирном хозяйстве. Под действием закона...
46959. Современная модель государственного управления в России 41 KB
  В настоящий момент система гос управления переживает период трансформации, поиска эффективной модели администрирования, способной удовлетворить потребности населения при минимальных издержках, лишенной чиновничьего произвола, работающей на общество.
46960. Електpифiкaцiя технoлoгiчних пpoцеciв в cвинapнику-вiдгoдiвельнику нa 1000 гoлiв 3.18 MB
  В дaнiй poбoтi здiйcненo електpифiкaцiю тa aвтoмaтизaцiю тaких технoлoгiчних пpoцеciв, як гнoєпpибиpaння, poздaчa кopмiв, пiдiгpiв вoди. Нaведенo вибip cилoвoгo i ocвiтлювaльнoгo oблaднaння, aпapaтiв кеpувaння i зaхиcту. Зpoблений pозpaхунoк електpичнoгo ocвiтлення cвинapникa.
46962. Учение Л.С. Выготского о предмете детской психологии, единице анализа психики и методы ее исследования. Переживание как единица анализа развития личности 39.5 KB
  Переживание как единица анализа развития личности. Выготского была направлена то чтобы перевести психологию от чисто описательного эмпирического и феноменологического изучения явлений к раскрытию их сущности предложив иное понимание хода условий источника формы специфики и движущих сил психического развития ребенка; описал эпохи стадии и фазы детского развития а также переходы между ними в ходе онтогенеза; он выявил и сформулировал основные законы психического развития ребенка....
46963. Характеристика кризиса подросткового возраста в концепции Л.И.Божович 39.5 KB
  Характеристика кризиса подросткового возраста в концепции Л. 387390 Кризис подросткового возраста значительно отличается от кризисов младших возрастов. В течение этого периода ломаются и перестраиваются все прежние отношения ребенка к миру и самому себе первая фаза подросткового возраста 1215 лет и развиваются процессы самосознания и самоопределения приводящие в конечном счете к той жизненной позиции с которой школьник начинает свою самостоятельную жизнь вторая фаза подросткового возраста 1517 лет; ее часто называют периодом ранней...
46964. Клинико-рентгенологическое проявления очагового туберкулеза 39.5 KB
  Выделяют в воспалительном процессе во время туберкулеза два варианта: очаг и инфильтрат. Здесь имеются туберкулезные бугорки в которых находятся большое количество эпителиоидных клеток отграничивающих казеозные маленькие фокусы содержащие микобактерии туберкулеза. В 5060 годы у нас очагового туберкулеза было много в пределах 4050 выявляли очаговый туберкулез. С годами в связи с применением массовой флюорографии своевременного выявления туберкулеза изменением иммунного фона удельный вес очагового туберкулеза падает не смотря на...