17471

Документальные системы АИС

Лекция

Информатика, кибернетика и программирование

Лекция Документальные системы Документальные системы предназначенные для обработки поиска представления полнотекстовых документов или справочнореферативной информации ведут свое происхождение от библиотечнореферативных служб или информационных центров вы...

Русский

2013-07-01

189.5 KB

52 чел.

Лекция  Документальные системы

Документальные системы (предназначенные для обработки, поиска, представления полнотекстовых документов или справочно-реферативной информации) ведут свое происхождение от библиотечно-реферативных служб или информационных центров, выпускающих реферативную информацию (обзоры, экспресс-информацию, реферативные журналы).

Происхождение документальных АИС

Первоначально, когда системы научно-технической информации (СНТИ) начали выпускать указатели, справочно-библиографические издания и др., все они предназначались собственно для удовлетворения потребностей информационных работников, облегчения оперирования большими массивами информации. По мере осознания полезности данных вторичных документов системы стали использовать научно-технические работники, что привело к необходимости развития индустриальных методов выпуска указателей, реферативных журналов, каталогов.

Подготовка данных для ввода в фотонаборные машины при выпуске изданий в СНТИ с помощью ЭВМ привела к накоплению массивов вторичных документов на машиночитаемых носителях. Следующим естественным шагом развития явилось непосредственное использование таких массивов в АИПС.

В перечне традиционных форм информационного обеспечения выделяют реферативный журнал (РЖ) как один из важнейших, по крайней мере, самый массовый продукт СНТИ. На рис. 2.6 приводится пример РЖ Всероссийского института научной и технической информации РАН (ВИНИТИ). Аналогичную структуру имеют и другие реферативные издания, например РЖ INIS (см. рис. 1.4).

Годовой комплект РЖ ВИНИТИ «Техническая кибернетика» состоит из 12 выпусков собственно РЖ и двух указателей. Каждый выпуск содержит около 500 статей-записей, описывающих первоисточники либо их фрагменты (журнальные статьи и др.). Здесь указаны: автор, заглавие, библиографические данные (год, том, номер, классификационный индекс, место издания и др.), реферат; запись имеет уникальный внутренний номер, идентифицирующий внутренний данный документ (реферат) также в авторском и предметных указателях. Латинские символы в скобках на рис. 2.6 соответствуют меткам полей при автоматизированном поиске (см. рис. 2.10).

Навигация при ручном поиске документальной информации

Рассмотрим деятельность потребителя информации (исследователя, группы) в аспекте поиска и потребления информации. Задачей потребителя является создание массива релевантных (потенциально необходимых) сообщений. Это достигается с помощью возможностей, создаваемых системой НТИ, а также ее продуктов — каталогами, указателями, РЖ и т. д.

В обобщенном виде поиск осуществляется по принципам навигации, вкратце описанным на рис. 2.7. Проследим одну из ветвей подобного поиска. Располагая наименованием тематики релевантной информации (например, кибернетика в механико-математических и физических науках, см. рис. 2.6), потребитель по предметному указателю определяет номер и заглавие реферата.

В принципе, имея заглавие, можно адресоваться к алфавитному каталогу библиотеки, однако, во-первых, это, как правило, заглавие статьи, а не название журнала, которое собственно и является входом в каталог, а во-вторых, целесообразно по реферату уточнить релевантность статьи. По номеру реферата (8.91.560, см. рис. 2.6) пользователь в соответствующем выпуске отыскивает статью, извлекает название издания («Сообщение ОИЯИ». 1990. № Р10-13047, см. рис. 2.6), по библиотечному каталогу определяет шифр хранения, заказывает первоисточник в фонде библиотеки.

Очевидно, данная траектория поиска, как и другие, очень трудоемка, и при продвижении по ней накапливаются ошибки, возможны потери и отказы.

Поэтому возникает необходимость автоматизации информационной деятельности как в рамках СНТИ (подготовка продуктов и услуг), так и потребителя (улучшение условий их использования). С этой целью создаются автоматизированные информационно-поисковые системы.

Исследования в области информационного поиска начались уже более тридцати лет назад. За это время из узкоспециализированной тематики информационный поиск превратился в одну из ключевых областей информатики.


Классические схемы функционирования документальных АИПС

Это режимы ретроспективного поиска (РП) и избирательного распределения информации (ПРИ). Данные схемы являются упорядоченными совокупностями функциональных подсистем реальных АИС, но не отображают структуру потоков и компоненты какой-либо из реальных современных систем и потому относятся к абстрактным АИПС.

Ретроспективный поиск. В АИПС режима РП могут быть выделены три функциональных блока: контура обработки документов, контур обработки запросов, блок поиска и выдачи документов (рис. 2.8).

Обработка первичного документа состоит в присвоении ему уникального номера (аналогичного шифру хранения, но не имеющего классификационных возможностей) и построении поискового

образа документа (ПОД) — формализованного отображения смысла сообщения на искусственном (информационно-поисковом, ИПЯ) языке. Множество ПОД образует поисковый массив. Прохождение зanpoca через систему аналогично: поисковый образ запроса (ПОЗ) подвергается обработке совместно с поисковым массивом. Каждый ПОД сопоставляется с данным ПОЗ с помощью критерия смыслового соответствия (КСС). В результате система выдает список номеров формально релевантных документов, соответствующих адресам хранения и являющихся основанием для поиска и окончательной выдачи первоисточников потребителю.

Очевидно, данный режим аналогичен библиотечному поиску (см. рис. 2.7 — тематика — предметный каталог — шифр хранения — первоисточник), а поисковый массив соответствует каталогу; кроме того, здесь поток не сохраняющихся разовых запросов сопоставляется с массивом постоянно хранящихся ПОД.

Избирательное распределение информации. В АИПС режима ИРИ (рис. 2.9), наоборот, поток не сохраняющихся ПОД взаимодействует с массивом постоянно действующих запросов (профилей ИРИ, поисковых образов абонентов — ПОА). В отличие от схемы

рис. 2.8, результаты автоматизированного поиска здесь непосредственно преобразуются в выдачу первоисточников (по номеру документа).

Современный период развития технических и программных средств начался в середине 60-х гг., когда корпорация IBM выпустила серию вычислительных установок (ЭВМ) System/360 (затем 370, 375). Программное обрамление ЭВМ составила классическая триада: OS/360, IMS/360, DPS/360:

OS (Operating System) — операционная система, функциональ
но полная и с точки зрения сегодняшнего дня;

IMS (Information Management System) — система управления
базами данных, породившая понятие
иерархической модели
данных;

DPS (Document Processing System) — программная оболочка до
кументального поиска.

Через несколько лет система DPS была сменена более совершенным продуктом — STAIRS (STorage And Information Retrieval System — система хранения и выдачи информации). STAIRS унаследовала основные положительные черты DPS и стала прототипом для многих аналогичных разработок вплоть до 1990—2000-х гг.


 

А также другие работы, которые могут Вас заинтересовать

28954. Теория и практика национальной политики большевиков. Образование СССР 47 KB
  Неустойчивость международного положения молодых советских республик в условиях капиталистического окружения также диктовала потребность в объединении. Значение этого разделения возросло после окончания Гражданской войны когда встала задача восстановления разрушенного хозяйства и преодоления экономической отсталости советских республик. сложился военнополитический союз советских республик. был подписан декрет Об объединении советских республик России Украины Латвии Литвы Белоруссии для борьбы с мировым империализмом.
28955. Новая экономическая политика и ее сущность 34 KB
  Нэп допускал некоторое развитие капиталистических элементов при сохранении командных высот народного хозяйства в руках государства диктатуры пролетариата; обеспечивал подъём производительных сил на базе роста социалистических и вытеснения капиталистических элементов преобразование многоукладной экономики в единую социалистическую на основе индустриализации страны и кооперирования сельского хозяйства. Нарушение в этот период экономических связей промышленности с сельское хозяйством через торговлю сокращение товарооборота подрывали...
28956. Курс большевистской партии на строительство социализма в одной стране. Индустриализация и коллективизация сельского хозяйства и их последствия 43.5 KB
  Предпосылки индустриализации. Техникоэкономическая отсталость могла стать хронической и перейти в историческую  необходимость индустриализации. Необходимость индустриализации. Социальная без индустриализации невозможно развитие экономики а следовательно и социальной сферы: образования здравоохранения сферы отдыха социального обеспечения.
28957. Формирование тоталитарно-бюрократического режима в СССР. Становление режима личной власти Сталина 25.5 KB
  Становление режима личной власти Сталина Борьба за власть среди партийных олигархов во второй половине 20х начале 30х годов. Постепенно расправившись со внутрипартийной оппозицией новая оппозиция троцкистскозиновьевский блок правый уклон в ВКПб попытка отстранить Сталина от власти на XVII съезде последовательно устранив с политической арены Каменева Зиновьева Троцкого Бухарина Рыкова и Томского Сталин к середине 30х годов сосредоточивает в своих руках все властные полномочия и фактически устанавливает тоталитарную форму...
28958. Обострение международной обстановки во второй половине 30-х годов XX века. Противоречивый характер внешней политики ведущих стран Запада и СССР накануне II-ой мировой войны 30.5 KB
  Противоречивый характер внешней политики ведущих стран Запада и СССР накануне IIой мировой войны. СССР подписал подобные договора с Францией и Чехословакией. СССР осудил введение в Германии всеобщей воинской повинности и нападение Италии на Эфиопию. был подписан договор о взаимопомощи между СССР и Монголией.
28959. СССР в условиях начавшейся II-ой мировой войны. Военные события конца 1939-1940 гг. и их современная оценка 42 KB
  СССР в условиях начавшейся IIой мировой войны. СССР объявил о своём нейтралитете. СССР и Германия подписали договор о дружбе и границе. СССР потребовал перенести границу от Ленинграда на 70 км.
28960. Начальный этап Великой Отечественной войны: причины неудач 94.5 KB
  Внешняя политика СССР в годы второй мировой войны. немецким военным командованием был разработан план молниеносной войны против СССР план Барбаросса . Захват Польши позволил фашистской армии создать плацдарм для нападения на Советский Союз на западных границах СССР оккупация Норвегии на северных Балканских стран на южных. Немецкой армии вторжения в приграничных военных округах СССР противостояли 170 дивизий насчитывавших 29 млн.
28961. СССР в послевоенный период. «Холодная война» и ее сущность 40.5 KB
  СССР в послевоенный период. ряд партийных руководителей ранее когдалибо работавших в Ленинграде были обвинены в попытке разрушить Советский союз противопоставив Россию СССР а Ленинград Москве. Внешняя политика Советского государства в первом послевоенном десятилетии Возросший после II мировой войны авторитет СССР базировался на военной мощи Советского государства и признательности европейских народов за освобождение от фашизма. дипломатические отношения с СССР поддерживали 26 стран то в 1945 г.
28962. Хрущевская «оттепель». Попытки осуществления политических и экономических реформ 31.5 KB
  После смерти Сталина в результате борьбы за власть в 1957 году Председателем Совета Министров был избран Н. Период после смерти Сталина и правления Н. После его смерти руководство КПСС предпринимало попытки по разоблачению преступлений сталинского периода. Но всё же впервые открыто о преступлениях сталинского периода было объявлено на ХХ съезде КПСС февраль 1956г.