17471

Документальные системы АИС

Лекция

Информатика, кибернетика и программирование

Лекция Документальные системы Документальные системы предназначенные для обработки поиска представления полнотекстовых документов или справочнореферативной информации ведут свое происхождение от библиотечнореферативных служб или информационных центров вы...

Русский

2013-07-01

189.5 KB

50 чел.

Лекция  Документальные системы

Документальные системы (предназначенные для обработки, поиска, представления полнотекстовых документов или справочно-реферативной информации) ведут свое происхождение от библиотечно-реферативных служб или информационных центров, выпускающих реферативную информацию (обзоры, экспресс-информацию, реферативные журналы).

Происхождение документальных АИС

Первоначально, когда системы научно-технической информации (СНТИ) начали выпускать указатели, справочно-библиографические издания и др., все они предназначались собственно для удовлетворения потребностей информационных работников, облегчения оперирования большими массивами информации. По мере осознания полезности данных вторичных документов системы стали использовать научно-технические работники, что привело к необходимости развития индустриальных методов выпуска указателей, реферативных журналов, каталогов.

Подготовка данных для ввода в фотонаборные машины при выпуске изданий в СНТИ с помощью ЭВМ привела к накоплению массивов вторичных документов на машиночитаемых носителях. Следующим естественным шагом развития явилось непосредственное использование таких массивов в АИПС.

В перечне традиционных форм информационного обеспечения выделяют реферативный журнал (РЖ) как один из важнейших, по крайней мере, самый массовый продукт СНТИ. На рис. 2.6 приводится пример РЖ Всероссийского института научной и технической информации РАН (ВИНИТИ). Аналогичную структуру имеют и другие реферативные издания, например РЖ INIS (см. рис. 1.4).

Годовой комплект РЖ ВИНИТИ «Техническая кибернетика» состоит из 12 выпусков собственно РЖ и двух указателей. Каждый выпуск содержит около 500 статей-записей, описывающих первоисточники либо их фрагменты (журнальные статьи и др.). Здесь указаны: автор, заглавие, библиографические данные (год, том, номер, классификационный индекс, место издания и др.), реферат; запись имеет уникальный внутренний номер, идентифицирующий внутренний данный документ (реферат) также в авторском и предметных указателях. Латинские символы в скобках на рис. 2.6 соответствуют меткам полей при автоматизированном поиске (см. рис. 2.10).

Навигация при ручном поиске документальной информации

Рассмотрим деятельность потребителя информации (исследователя, группы) в аспекте поиска и потребления информации. Задачей потребителя является создание массива релевантных (потенциально необходимых) сообщений. Это достигается с помощью возможностей, создаваемых системой НТИ, а также ее продуктов — каталогами, указателями, РЖ и т. д.

В обобщенном виде поиск осуществляется по принципам навигации, вкратце описанным на рис. 2.7. Проследим одну из ветвей подобного поиска. Располагая наименованием тематики релевантной информации (например, кибернетика в механико-математических и физических науках, см. рис. 2.6), потребитель по предметному указателю определяет номер и заглавие реферата.

В принципе, имея заглавие, можно адресоваться к алфавитному каталогу библиотеки, однако, во-первых, это, как правило, заглавие статьи, а не название журнала, которое собственно и является входом в каталог, а во-вторых, целесообразно по реферату уточнить релевантность статьи. По номеру реферата (8.91.560, см. рис. 2.6) пользователь в соответствующем выпуске отыскивает статью, извлекает название издания («Сообщение ОИЯИ». 1990. № Р10-13047, см. рис. 2.6), по библиотечному каталогу определяет шифр хранения, заказывает первоисточник в фонде библиотеки.

Очевидно, данная траектория поиска, как и другие, очень трудоемка, и при продвижении по ней накапливаются ошибки, возможны потери и отказы.

Поэтому возникает необходимость автоматизации информационной деятельности как в рамках СНТИ (подготовка продуктов и услуг), так и потребителя (улучшение условий их использования). С этой целью создаются автоматизированные информационно-поисковые системы.

Исследования в области информационного поиска начались уже более тридцати лет назад. За это время из узкоспециализированной тематики информационный поиск превратился в одну из ключевых областей информатики.


Классические схемы функционирования документальных АИПС

Это режимы ретроспективного поиска (РП) и избирательного распределения информации (ПРИ). Данные схемы являются упорядоченными совокупностями функциональных подсистем реальных АИС, но не отображают структуру потоков и компоненты какой-либо из реальных современных систем и потому относятся к абстрактным АИПС.

Ретроспективный поиск. В АИПС режима РП могут быть выделены три функциональных блока: контура обработки документов, контур обработки запросов, блок поиска и выдачи документов (рис. 2.8).

Обработка первичного документа состоит в присвоении ему уникального номера (аналогичного шифру хранения, но не имеющего классификационных возможностей) и построении поискового

образа документа (ПОД) — формализованного отображения смысла сообщения на искусственном (информационно-поисковом, ИПЯ) языке. Множество ПОД образует поисковый массив. Прохождение зanpoca через систему аналогично: поисковый образ запроса (ПОЗ) подвергается обработке совместно с поисковым массивом. Каждый ПОД сопоставляется с данным ПОЗ с помощью критерия смыслового соответствия (КСС). В результате система выдает список номеров формально релевантных документов, соответствующих адресам хранения и являющихся основанием для поиска и окончательной выдачи первоисточников потребителю.

Очевидно, данный режим аналогичен библиотечному поиску (см. рис. 2.7 — тематика — предметный каталог — шифр хранения — первоисточник), а поисковый массив соответствует каталогу; кроме того, здесь поток не сохраняющихся разовых запросов сопоставляется с массивом постоянно хранящихся ПОД.

Избирательное распределение информации. В АИПС режима ИРИ (рис. 2.9), наоборот, поток не сохраняющихся ПОД взаимодействует с массивом постоянно действующих запросов (профилей ИРИ, поисковых образов абонентов — ПОА). В отличие от схемы

рис. 2.8, результаты автоматизированного поиска здесь непосредственно преобразуются в выдачу первоисточников (по номеру документа).

Современный период развития технических и программных средств начался в середине 60-х гг., когда корпорация IBM выпустила серию вычислительных установок (ЭВМ) System/360 (затем 370, 375). Программное обрамление ЭВМ составила классическая триада: OS/360, IMS/360, DPS/360:

OS (Operating System) — операционная система, функциональ
но полная и с точки зрения сегодняшнего дня;

IMS (Information Management System) — система управления
базами данных, породившая понятие
иерархической модели
данных;

DPS (Document Processing System) — программная оболочка до
кументального поиска.

Через несколько лет система DPS была сменена более совершенным продуктом — STAIRS (STorage And Information Retrieval System — система хранения и выдачи информации). STAIRS унаследовала основные положительные черты DPS и стала прототипом для многих аналогичных разработок вплоть до 1990—2000-х гг.


 

А также другие работы, которые могут Вас заинтересовать

20029. СССР в 1945-1953. Восстановление экономики после ВОВ. Послевоенный сталинизм 14.66 KB
  В конце 1940 возникло ленинградское дело обвинение видных деятелей партии в намерении превратить ленинград в опору борьбы со сталиным были расстреляны Вознесенский Радионов Кузнецов. 1953 дело врачей было арестовано группа врачей кремлевской больницы по обвинению в том что она якобы повинны смерти жданова и пытались умертвить других государственных деятелей но со смертью сталина дело было прекращено.
20030. Послевоенный мир, его разделение на две системы. Переход в холодной войне 15.91 KB
  – ОВД Организация Варшавского ДоговораСССР. Гонка вооружений наращивание СССР и США количества вооружений с целью достижения качественного превосходства. В СССР эта политика проявлялась в создании железного занавеса системы международной самоизоляции. Причины холодной войны: Победа во II мировой войне привела к резкому усилению СССР и США.
20031. Попытки реформирования советской системы в 1950-60. Н.С Хрущев 17.59 KB
  С Хрущев. Борьба за личное лидерство длилась вплоть до весны 1958 но в итоге к власти пришел Хрущев.Начатая Хрущевым критика сталинизма привела к некоторой либерализации общественной жизни общества оттепель. Хрущева В 1954 г.
20032. СССР в период застоя(1964-1985) 14.54 KB
  к и в политической экономической и культурной жизни страны все было стабильно не было ничего нового. В культурной жизни зарождалось дессидентское движениенелегальные кружки интеллигенции выступающие за свержение коммунизма правительство полностью контролировало культурную жизнь странывыссылка из страны неугодных большевикам людейсолженицын плесецаявишневская 18 лет руководство брежнева перевели государство в состояние развала 1982Брежнев умирает с 18821884 правил Андропов а 18841885 Черненко общество жило от похорон до похорон...
20033. Перестройка-от частных преобразований к смене модели общественного развития(1985-1991) 14.85 KB
  В апреле 1985 –было объявлено о проведении масштабных реформ с целью изменения общества например в экономике курс на ускорениеэто повышение темпов экономического роста на базе научнотехнического прогресса Первыми перестроечными законами стала антиалкогольная компания и закон о госприемке но все эти меры не дали никаких результатов да и к тому же всю обстановку осложнила авария на чернобыльской АЭС 1986. Основная задача перестройки заключалась в придании экономике рыночных основ. Первым шагом к рыночной экономике стал закон о гос.
20034. Новая Россия в 90 годы 20 века 16.18 KB
  В середине 1980 административные структуры в союзных республиках начали борьбу за усиление собственной власти начались трения между коренными жителями и русскоязычным населением рухнул миф о дружбе народов СССРвыступление в казахстане столкновение в фергане наколились взаимоотношения грузии с абхазией с целью прекратить эти волнения горбачев задумал подписание нового союзного договора подписание которого было назначено на 20 августа 1991 19 авг. Начался антигосударственный переворот по радио было объявлено об отстранение президента...
20035. Гражданская война (1918-1920). Причины, этапы, итоги, последствия войны 16.63 KB
  Причинами гражданской войны в России можно считать противостояние двух политических лагерей – красных и белых красные –большевики бедные крестьяне и рабочие белые – зажиточное крестьянство офицеры казаки дворянство студенчество. Войны являлась прежде всего участие иностранных держав они поддерживали белыхиностранная интервенция. Многочисленные хорошо вооруженные и организованные за счет Антанты армии белых генералов взяли ее в кольцо. Декабрь 19201922 гокончательный разгром белого движения на юге России Причины победы красных в...
20036. Советское общество в 1920-е года 10.88 KB
  Началось антибольшевистское движение: крестьяне выступали в Тамбовской и Воронежской губерниях рабочие в Москве и Петрограде матросы в Кронштадте НЭП экономическая политика проводившаяся в Советской России и СССР в 1920е годы Март 1921г. была провозглашена НЭП 1. Привлекался иностранный капитал Концессии для участия в российской промышленности Итог НЭПа: экономика страны достигла довоенного уровня. К концу 20х годов НЭП был свернут.
20037. Сталинская модернизация 15.15 KB
  Ее главными мероприятиями стали индустриализация коллективизация. Коллективизация Официально коллективизация началась 7 ноября 1929 г. Сталину становится ясно что коллективизация может привести к серьезному экономическому и политическому кризису . сплошная коллективизация возобновилась.