17471

Документальные системы АИС

Лекция

Информатика, кибернетика и программирование

Лекция Документальные системы Документальные системы предназначенные для обработки поиска представления полнотекстовых документов или справочнореферативной информации ведут свое происхождение от библиотечнореферативных служб или информационных центров вы...

Русский

2013-07-01

189.5 KB

52 чел.

Лекция  Документальные системы

Документальные системы (предназначенные для обработки, поиска, представления полнотекстовых документов или справочно-реферативной информации) ведут свое происхождение от библиотечно-реферативных служб или информационных центров, выпускающих реферативную информацию (обзоры, экспресс-информацию, реферативные журналы).

Происхождение документальных АИС

Первоначально, когда системы научно-технической информации (СНТИ) начали выпускать указатели, справочно-библиографические издания и др., все они предназначались собственно для удовлетворения потребностей информационных работников, облегчения оперирования большими массивами информации. По мере осознания полезности данных вторичных документов системы стали использовать научно-технические работники, что привело к необходимости развития индустриальных методов выпуска указателей, реферативных журналов, каталогов.

Подготовка данных для ввода в фотонаборные машины при выпуске изданий в СНТИ с помощью ЭВМ привела к накоплению массивов вторичных документов на машиночитаемых носителях. Следующим естественным шагом развития явилось непосредственное использование таких массивов в АИПС.

В перечне традиционных форм информационного обеспечения выделяют реферативный журнал (РЖ) как один из важнейших, по крайней мере, самый массовый продукт СНТИ. На рис. 2.6 приводится пример РЖ Всероссийского института научной и технической информации РАН (ВИНИТИ). Аналогичную структуру имеют и другие реферативные издания, например РЖ INIS (см. рис. 1.4).

Годовой комплект РЖ ВИНИТИ «Техническая кибернетика» состоит из 12 выпусков собственно РЖ и двух указателей. Каждый выпуск содержит около 500 статей-записей, описывающих первоисточники либо их фрагменты (журнальные статьи и др.). Здесь указаны: автор, заглавие, библиографические данные (год, том, номер, классификационный индекс, место издания и др.), реферат; запись имеет уникальный внутренний номер, идентифицирующий внутренний данный документ (реферат) также в авторском и предметных указателях. Латинские символы в скобках на рис. 2.6 соответствуют меткам полей при автоматизированном поиске (см. рис. 2.10).

Навигация при ручном поиске документальной информации

Рассмотрим деятельность потребителя информации (исследователя, группы) в аспекте поиска и потребления информации. Задачей потребителя является создание массива релевантных (потенциально необходимых) сообщений. Это достигается с помощью возможностей, создаваемых системой НТИ, а также ее продуктов — каталогами, указателями, РЖ и т. д.

В обобщенном виде поиск осуществляется по принципам навигации, вкратце описанным на рис. 2.7. Проследим одну из ветвей подобного поиска. Располагая наименованием тематики релевантной информации (например, кибернетика в механико-математических и физических науках, см. рис. 2.6), потребитель по предметному указателю определяет номер и заглавие реферата.

В принципе, имея заглавие, можно адресоваться к алфавитному каталогу библиотеки, однако, во-первых, это, как правило, заглавие статьи, а не название журнала, которое собственно и является входом в каталог, а во-вторых, целесообразно по реферату уточнить релевантность статьи. По номеру реферата (8.91.560, см. рис. 2.6) пользователь в соответствующем выпуске отыскивает статью, извлекает название издания («Сообщение ОИЯИ». 1990. № Р10-13047, см. рис. 2.6), по библиотечному каталогу определяет шифр хранения, заказывает первоисточник в фонде библиотеки.

Очевидно, данная траектория поиска, как и другие, очень трудоемка, и при продвижении по ней накапливаются ошибки, возможны потери и отказы.

Поэтому возникает необходимость автоматизации информационной деятельности как в рамках СНТИ (подготовка продуктов и услуг), так и потребителя (улучшение условий их использования). С этой целью создаются автоматизированные информационно-поисковые системы.

Исследования в области информационного поиска начались уже более тридцати лет назад. За это время из узкоспециализированной тематики информационный поиск превратился в одну из ключевых областей информатики.


Классические схемы функционирования документальных АИПС

Это режимы ретроспективного поиска (РП) и избирательного распределения информации (ПРИ). Данные схемы являются упорядоченными совокупностями функциональных подсистем реальных АИС, но не отображают структуру потоков и компоненты какой-либо из реальных современных систем и потому относятся к абстрактным АИПС.

Ретроспективный поиск. В АИПС режима РП могут быть выделены три функциональных блока: контура обработки документов, контур обработки запросов, блок поиска и выдачи документов (рис. 2.8).

Обработка первичного документа состоит в присвоении ему уникального номера (аналогичного шифру хранения, но не имеющего классификационных возможностей) и построении поискового

образа документа (ПОД) — формализованного отображения смысла сообщения на искусственном (информационно-поисковом, ИПЯ) языке. Множество ПОД образует поисковый массив. Прохождение зanpoca через систему аналогично: поисковый образ запроса (ПОЗ) подвергается обработке совместно с поисковым массивом. Каждый ПОД сопоставляется с данным ПОЗ с помощью критерия смыслового соответствия (КСС). В результате система выдает список номеров формально релевантных документов, соответствующих адресам хранения и являющихся основанием для поиска и окончательной выдачи первоисточников потребителю.

Очевидно, данный режим аналогичен библиотечному поиску (см. рис. 2.7 — тематика — предметный каталог — шифр хранения — первоисточник), а поисковый массив соответствует каталогу; кроме того, здесь поток не сохраняющихся разовых запросов сопоставляется с массивом постоянно хранящихся ПОД.

Избирательное распределение информации. В АИПС режима ИРИ (рис. 2.9), наоборот, поток не сохраняющихся ПОД взаимодействует с массивом постоянно действующих запросов (профилей ИРИ, поисковых образов абонентов — ПОА). В отличие от схемы

рис. 2.8, результаты автоматизированного поиска здесь непосредственно преобразуются в выдачу первоисточников (по номеру документа).

Современный период развития технических и программных средств начался в середине 60-х гг., когда корпорация IBM выпустила серию вычислительных установок (ЭВМ) System/360 (затем 370, 375). Программное обрамление ЭВМ составила классическая триада: OS/360, IMS/360, DPS/360:

OS (Operating System) — операционная система, функциональ
но полная и с точки зрения сегодняшнего дня;

IMS (Information Management System) — система управления
базами данных, породившая понятие
иерархической модели
данных;

DPS (Document Processing System) — программная оболочка до
кументального поиска.

Через несколько лет система DPS была сменена более совершенным продуктом — STAIRS (STorage And Information Retrieval System — система хранения и выдачи информации). STAIRS унаследовала основные положительные черты DPS и стала прототипом для многих аналогичных разработок вплоть до 1990—2000-х гг.


 

А также другие работы, которые могут Вас заинтересовать

58453. Застосування загального правила додавання двоцифрових чисел до обчислень виду 54 + 30, 54 + 3 47 KB
  Мета. Формувати вміння застосовувати загальне правило додавання двоцифрових чисел до окремих випадків, коли в одному із компонентів цих дій відсутні десятки або одиниці; закріплювати вміння розвязувати задачі.
58454. Вторая война Рима с Карфагеном (218-201 гг. до н.э.) 57 KB
  Это выдающийся карфагенский полководец Ганнибал. С детских лет Ганнибал готовился к войне с римлянами. Ганнибал произнес вслед за ним: Клянусь что я никогда не буду другом римлян и сделаю им столько зла сколько смогу Ганнибал до самой смерти остался верен этой клятве. Ганнибал был образованным человеком.
58457. Общая характеристика продукции 122.5 KB
  Общая характеристика продукции Результат труда чаще выступает в материальной форме в виде продукции. Изготавливаемая на предприятии продукция на разных стадиях технологического процесса находится в виде незавершенного производства полуфабриката или готового изделия продукции. Незавершенное производство это продукция не получившая законченного вида в пределах производства а также продукция не проверенная ОТК и не сданная на склад готовой продукции. Планирование и учет изготовлений продукции осуществляется в натуральных...
58458. РАДІОПРИЙМАЛЬНИЙ ПРИСТРІЙ РАДІОЛОКАЦІЙНИХ СИГНАЛІВ З РОЗРАХУНКОМ ПІДСИЛЮВАЧА ВИСОКОЇ ЧАСТОТИ 104.5 KB
  о складу системи входять джерело радіовипромінювання, лінія передачі та радіоприймальний пристрій. Джерело радіовипромінювання може удавати з себе або радіопередавальний пристрій або пасивний відбива
58459. Электроустановки с изолированными и глухозаземленными нейтралями 174 KB
  Вид связи нейтралей машин и трансформаторов с землей в значительной степени определяет уровень изоляции электроустановок и выбор коммутационной аппаратуры значения перенапряжений и способы их ограничения токи при однофазных замыканиях на землю условия работы релейной защиты и безопасности...
58460. Организация и порядок проведения капитальных ремонтов 41.5 KB
  Планово-предупредительный ремонт представляет собой комплекс работ, направленных на поддержание и восстановление работоспособности оборудования путем обслуживания, ремонта и замены изношенных деталей и узлов с тем, чтобы в дальнейшем обеспечить его надежную и экономичную работу.
58461. Розповідається про... 987 KB
  Мета: вчити першокласників визначати жанр твору працювати з тлумачним словни ком удосконалювати вміння працювати з текстом; сприяти формуванню грамотності; розвивати мовлення мислення уважність швидкість читання; збагачувати словниковий запас учнів...