17471

Документальные системы АИС

Лекция

Информатика, кибернетика и программирование

Лекция Документальные системы Документальные системы предназначенные для обработки поиска представления полнотекстовых документов или справочнореферативной информации ведут свое происхождение от библиотечнореферативных служб или информационных центров вы...

Русский

2013-07-01

189.5 KB

52 чел.

Лекция  Документальные системы

Документальные системы (предназначенные для обработки, поиска, представления полнотекстовых документов или справочно-реферативной информации) ведут свое происхождение от библиотечно-реферативных служб или информационных центров, выпускающих реферативную информацию (обзоры, экспресс-информацию, реферативные журналы).

Происхождение документальных АИС

Первоначально, когда системы научно-технической информации (СНТИ) начали выпускать указатели, справочно-библиографические издания и др., все они предназначались собственно для удовлетворения потребностей информационных работников, облегчения оперирования большими массивами информации. По мере осознания полезности данных вторичных документов системы стали использовать научно-технические работники, что привело к необходимости развития индустриальных методов выпуска указателей, реферативных журналов, каталогов.

Подготовка данных для ввода в фотонаборные машины при выпуске изданий в СНТИ с помощью ЭВМ привела к накоплению массивов вторичных документов на машиночитаемых носителях. Следующим естественным шагом развития явилось непосредственное использование таких массивов в АИПС.

В перечне традиционных форм информационного обеспечения выделяют реферативный журнал (РЖ) как один из важнейших, по крайней мере, самый массовый продукт СНТИ. На рис. 2.6 приводится пример РЖ Всероссийского института научной и технической информации РАН (ВИНИТИ). Аналогичную структуру имеют и другие реферативные издания, например РЖ INIS (см. рис. 1.4).

Годовой комплект РЖ ВИНИТИ «Техническая кибернетика» состоит из 12 выпусков собственно РЖ и двух указателей. Каждый выпуск содержит около 500 статей-записей, описывающих первоисточники либо их фрагменты (журнальные статьи и др.). Здесь указаны: автор, заглавие, библиографические данные (год, том, номер, классификационный индекс, место издания и др.), реферат; запись имеет уникальный внутренний номер, идентифицирующий внутренний данный документ (реферат) также в авторском и предметных указателях. Латинские символы в скобках на рис. 2.6 соответствуют меткам полей при автоматизированном поиске (см. рис. 2.10).

Навигация при ручном поиске документальной информации

Рассмотрим деятельность потребителя информации (исследователя, группы) в аспекте поиска и потребления информации. Задачей потребителя является создание массива релевантных (потенциально необходимых) сообщений. Это достигается с помощью возможностей, создаваемых системой НТИ, а также ее продуктов — каталогами, указателями, РЖ и т. д.

В обобщенном виде поиск осуществляется по принципам навигации, вкратце описанным на рис. 2.7. Проследим одну из ветвей подобного поиска. Располагая наименованием тематики релевантной информации (например, кибернетика в механико-математических и физических науках, см. рис. 2.6), потребитель по предметному указателю определяет номер и заглавие реферата.

В принципе, имея заглавие, можно адресоваться к алфавитному каталогу библиотеки, однако, во-первых, это, как правило, заглавие статьи, а не название журнала, которое собственно и является входом в каталог, а во-вторых, целесообразно по реферату уточнить релевантность статьи. По номеру реферата (8.91.560, см. рис. 2.6) пользователь в соответствующем выпуске отыскивает статью, извлекает название издания («Сообщение ОИЯИ». 1990. № Р10-13047, см. рис. 2.6), по библиотечному каталогу определяет шифр хранения, заказывает первоисточник в фонде библиотеки.

Очевидно, данная траектория поиска, как и другие, очень трудоемка, и при продвижении по ней накапливаются ошибки, возможны потери и отказы.

Поэтому возникает необходимость автоматизации информационной деятельности как в рамках СНТИ (подготовка продуктов и услуг), так и потребителя (улучшение условий их использования). С этой целью создаются автоматизированные информационно-поисковые системы.

Исследования в области информационного поиска начались уже более тридцати лет назад. За это время из узкоспециализированной тематики информационный поиск превратился в одну из ключевых областей информатики.


Классические схемы функционирования документальных АИПС

Это режимы ретроспективного поиска (РП) и избирательного распределения информации (ПРИ). Данные схемы являются упорядоченными совокупностями функциональных подсистем реальных АИС, но не отображают структуру потоков и компоненты какой-либо из реальных современных систем и потому относятся к абстрактным АИПС.

Ретроспективный поиск. В АИПС режима РП могут быть выделены три функциональных блока: контура обработки документов, контур обработки запросов, блок поиска и выдачи документов (рис. 2.8).

Обработка первичного документа состоит в присвоении ему уникального номера (аналогичного шифру хранения, но не имеющего классификационных возможностей) и построении поискового

образа документа (ПОД) — формализованного отображения смысла сообщения на искусственном (информационно-поисковом, ИПЯ) языке. Множество ПОД образует поисковый массив. Прохождение зanpoca через систему аналогично: поисковый образ запроса (ПОЗ) подвергается обработке совместно с поисковым массивом. Каждый ПОД сопоставляется с данным ПОЗ с помощью критерия смыслового соответствия (КСС). В результате система выдает список номеров формально релевантных документов, соответствующих адресам хранения и являющихся основанием для поиска и окончательной выдачи первоисточников потребителю.

Очевидно, данный режим аналогичен библиотечному поиску (см. рис. 2.7 — тематика — предметный каталог — шифр хранения — первоисточник), а поисковый массив соответствует каталогу; кроме того, здесь поток не сохраняющихся разовых запросов сопоставляется с массивом постоянно хранящихся ПОД.

Избирательное распределение информации. В АИПС режима ИРИ (рис. 2.9), наоборот, поток не сохраняющихся ПОД взаимодействует с массивом постоянно действующих запросов (профилей ИРИ, поисковых образов абонентов — ПОА). В отличие от схемы

рис. 2.8, результаты автоматизированного поиска здесь непосредственно преобразуются в выдачу первоисточников (по номеру документа).

Современный период развития технических и программных средств начался в середине 60-х гг., когда корпорация IBM выпустила серию вычислительных установок (ЭВМ) System/360 (затем 370, 375). Программное обрамление ЭВМ составила классическая триада: OS/360, IMS/360, DPS/360:

OS (Operating System) — операционная система, функциональ
но полная и с точки зрения сегодняшнего дня;

IMS (Information Management System) — система управления
базами данных, породившая понятие
иерархической модели
данных;

DPS (Document Processing System) — программная оболочка до
кументального поиска.

Через несколько лет система DPS была сменена более совершенным продуктом — STAIRS (STorage And Information Retrieval System — система хранения и выдачи информации). STAIRS унаследовала основные положительные черты DPS и стала прототипом для многих аналогичных разработок вплоть до 1990—2000-х гг.


 

А также другие работы, которые могут Вас заинтересовать

42033. Дослідження законів Ома та Кіргофа в колах першого порядку 2.47 MB
  Замалюйте цей графік. Замалюйте графік із заданими значеннями а потім вкажіть декілька своїх для амплітуди та частоти та замалюйте ще кілька графіків. Ба Замалювали графік рис. 5 Вказали своє значення для амплітуди та частоти та замалювали графік.
42034. Електричні кола з послідовним зєднанням елементів 97.5 KB
  Комплексний опір ланцюга реактивний опір ланцюга опір індуктивності опір ємності опір резистора На малюнку зображено як саме опір елементів залежить від частоти: Рис. комплексний опір ланцюга реактивний опір ланцюга опір індуктивності опір ємності опір резистора На малюнку зображено як саме опір елементів залежить від частоти: Рис. 2 З малюнка легко бачити що тільки опір резистора не залежить від частоти.3Напруга на резисторі Поняття про резонанс напруг На частотах реактивний опір кола дорівнює...
42036. Изучение работы жидкостного U-образного манометра и комплекта приборов для измерения давления пневматической ветви ГСП 785 KB
  Давление питания преобразователей 14014 кгс см2 0140014 МПа Расход воздуха питания в установившемся режиме не более 8 л мин. Рабочий диапазон изменения выходного пневматического сигнала составляет 08 кгс см2 008 МПа. При изменении перепада давления от нуля до предельного номинального значения выходной сигнал изменяется от 02 до 10 кгс см2 от 002 до 01 МПа. Расчетные значения выходных сигналов Sp для номинального перепада давления...
42038. Изучение работы приборов для измерения давления электрической ветви ГСП 112 KB
  Студенты знакомятся с принципом действия устройством преобразователя измерительного Метран43 в комплекте с вторичным прибором и приобретают навыки в определении давления при помощи измерительных преобразователей типа Метран43. Снимают статическую характеристику измерительного преобразователя Метран43. Преобразователи давления типа Метран43 Преобразователи разности давления типа Метран43 предназначены для промышленных систем автоматического контроля и систем в составе АСУ ТП на базе микропроцессорной техники работающих со...