17471

Документальные системы АИС

Лекция

Информатика, кибернетика и программирование

Лекция Документальные системы Документальные системы предназначенные для обработки поиска представления полнотекстовых документов или справочнореферативной информации ведут свое происхождение от библиотечнореферативных служб или информационных центров вы...

Русский

2013-07-01

189.5 KB

51 чел.

Лекция  Документальные системы

Документальные системы (предназначенные для обработки, поиска, представления полнотекстовых документов или справочно-реферативной информации) ведут свое происхождение от библиотечно-реферативных служб или информационных центров, выпускающих реферативную информацию (обзоры, экспресс-информацию, реферативные журналы).

Происхождение документальных АИС

Первоначально, когда системы научно-технической информации (СНТИ) начали выпускать указатели, справочно-библиографические издания и др., все они предназначались собственно для удовлетворения потребностей информационных работников, облегчения оперирования большими массивами информации. По мере осознания полезности данных вторичных документов системы стали использовать научно-технические работники, что привело к необходимости развития индустриальных методов выпуска указателей, реферативных журналов, каталогов.

Подготовка данных для ввода в фотонаборные машины при выпуске изданий в СНТИ с помощью ЭВМ привела к накоплению массивов вторичных документов на машиночитаемых носителях. Следующим естественным шагом развития явилось непосредственное использование таких массивов в АИПС.

В перечне традиционных форм информационного обеспечения выделяют реферативный журнал (РЖ) как один из важнейших, по крайней мере, самый массовый продукт СНТИ. На рис. 2.6 приводится пример РЖ Всероссийского института научной и технической информации РАН (ВИНИТИ). Аналогичную структуру имеют и другие реферативные издания, например РЖ INIS (см. рис. 1.4).

Годовой комплект РЖ ВИНИТИ «Техническая кибернетика» состоит из 12 выпусков собственно РЖ и двух указателей. Каждый выпуск содержит около 500 статей-записей, описывающих первоисточники либо их фрагменты (журнальные статьи и др.). Здесь указаны: автор, заглавие, библиографические данные (год, том, номер, классификационный индекс, место издания и др.), реферат; запись имеет уникальный внутренний номер, идентифицирующий внутренний данный документ (реферат) также в авторском и предметных указателях. Латинские символы в скобках на рис. 2.6 соответствуют меткам полей при автоматизированном поиске (см. рис. 2.10).

Навигация при ручном поиске документальной информации

Рассмотрим деятельность потребителя информации (исследователя, группы) в аспекте поиска и потребления информации. Задачей потребителя является создание массива релевантных (потенциально необходимых) сообщений. Это достигается с помощью возможностей, создаваемых системой НТИ, а также ее продуктов — каталогами, указателями, РЖ и т. д.

В обобщенном виде поиск осуществляется по принципам навигации, вкратце описанным на рис. 2.7. Проследим одну из ветвей подобного поиска. Располагая наименованием тематики релевантной информации (например, кибернетика в механико-математических и физических науках, см. рис. 2.6), потребитель по предметному указателю определяет номер и заглавие реферата.

В принципе, имея заглавие, можно адресоваться к алфавитному каталогу библиотеки, однако, во-первых, это, как правило, заглавие статьи, а не название журнала, которое собственно и является входом в каталог, а во-вторых, целесообразно по реферату уточнить релевантность статьи. По номеру реферата (8.91.560, см. рис. 2.6) пользователь в соответствующем выпуске отыскивает статью, извлекает название издания («Сообщение ОИЯИ». 1990. № Р10-13047, см. рис. 2.6), по библиотечному каталогу определяет шифр хранения, заказывает первоисточник в фонде библиотеки.

Очевидно, данная траектория поиска, как и другие, очень трудоемка, и при продвижении по ней накапливаются ошибки, возможны потери и отказы.

Поэтому возникает необходимость автоматизации информационной деятельности как в рамках СНТИ (подготовка продуктов и услуг), так и потребителя (улучшение условий их использования). С этой целью создаются автоматизированные информационно-поисковые системы.

Исследования в области информационного поиска начались уже более тридцати лет назад. За это время из узкоспециализированной тематики информационный поиск превратился в одну из ключевых областей информатики.


Классические схемы функционирования документальных АИПС

Это режимы ретроспективного поиска (РП) и избирательного распределения информации (ПРИ). Данные схемы являются упорядоченными совокупностями функциональных подсистем реальных АИС, но не отображают структуру потоков и компоненты какой-либо из реальных современных систем и потому относятся к абстрактным АИПС.

Ретроспективный поиск. В АИПС режима РП могут быть выделены три функциональных блока: контура обработки документов, контур обработки запросов, блок поиска и выдачи документов (рис. 2.8).

Обработка первичного документа состоит в присвоении ему уникального номера (аналогичного шифру хранения, но не имеющего классификационных возможностей) и построении поискового

образа документа (ПОД) — формализованного отображения смысла сообщения на искусственном (информационно-поисковом, ИПЯ) языке. Множество ПОД образует поисковый массив. Прохождение зanpoca через систему аналогично: поисковый образ запроса (ПОЗ) подвергается обработке совместно с поисковым массивом. Каждый ПОД сопоставляется с данным ПОЗ с помощью критерия смыслового соответствия (КСС). В результате система выдает список номеров формально релевантных документов, соответствующих адресам хранения и являющихся основанием для поиска и окончательной выдачи первоисточников потребителю.

Очевидно, данный режим аналогичен библиотечному поиску (см. рис. 2.7 — тематика — предметный каталог — шифр хранения — первоисточник), а поисковый массив соответствует каталогу; кроме того, здесь поток не сохраняющихся разовых запросов сопоставляется с массивом постоянно хранящихся ПОД.

Избирательное распределение информации. В АИПС режима ИРИ (рис. 2.9), наоборот, поток не сохраняющихся ПОД взаимодействует с массивом постоянно действующих запросов (профилей ИРИ, поисковых образов абонентов — ПОА). В отличие от схемы

рис. 2.8, результаты автоматизированного поиска здесь непосредственно преобразуются в выдачу первоисточников (по номеру документа).

Современный период развития технических и программных средств начался в середине 60-х гг., когда корпорация IBM выпустила серию вычислительных установок (ЭВМ) System/360 (затем 370, 375). Программное обрамление ЭВМ составила классическая триада: OS/360, IMS/360, DPS/360:

OS (Operating System) — операционная система, функциональ
но полная и с точки зрения сегодняшнего дня;

IMS (Information Management System) — система управления
базами данных, породившая понятие
иерархической модели
данных;

DPS (Document Processing System) — программная оболочка до
кументального поиска.

Через несколько лет система DPS была сменена более совершенным продуктом — STAIRS (STorage And Information Retrieval System — система хранения и выдачи информации). STAIRS унаследовала основные положительные черты DPS и стала прототипом для многих аналогичных разработок вплоть до 1990—2000-х гг.


 

А также другие работы, которые могут Вас заинтересовать

34297. Репаративная регенерация, её значение. Способы репаративной регенерации. Типичная и атипичная регенерация. Особенности восстановительных процессов у млекопитающих. Значение регенерации для биологии и медицины 18.51 KB
  Морфаллаксис – влечет за собой перегруппировку оставшейся части организма. Нередко связан с дальнейшим значительным разрушением оставшейся части и завершается формированием из этого материала целого организма или органа. Если условия будут меняться то возникает реакция организма. В результате изменений: сохранение постоянства внутренней среды поддержание целостности организма.
34298. Регенерация 43 KB
  В большей степени регенерация присуща растениям и беспозвоночным животным в меньшей позвоночным. Регенерация в медицине полное восстановление утраченных частей. Регенерация у животных и человека образование новых структур взамен удалённых либо погибших в результате повреждения репаратинпая регенерация или утраченных в процессе нормальной жизнедеятельности физиологнческая регенерация; вторичное развитие вызванное утратой развившегося ранее органа.
34299. РЕГЕНЕРА́ЦИЯ 34 KB
  Иногда при регенерации вместо нормального числа пальцев образуется их больше или вместо одного хвоста вырастает два или три. Часто способность к регенерации стоит в связи с защитной способностью отбрасывать органы в момент опасности вследствие сильного сокращения мышц например защемленную лапку придавленный хвост и т. Благодаря физиологической регенерации поддерживается структурный гомеостаз и обеспечивается возможность постоянного выполнения органами их функций. Во многих тканях существуют специальные камбиальные клетки и очаги их...
34300. Смерть как биологическое явление 114 KB
  Интенсивность смертности мужчин в зависимости от их возраста Швеция На неизменяемость скорости старения в конкретной популяции людей в течение XX в. несмотря на существенное повышение жизненного уровня указывают например данные об абсолютном возрастном приросте интенсивности смертности мужчин Швеции с 1900 по 1980 г. Швеция: 1 интенсивность смертности мужчин в возрасте 40 лет 2 то же в возрасте 30 лет 3 скорость старения мужчин в возрастном интервале 30 40 лет Сделанное заключение хорошо согласуется с теми изменениями которые...
34302. Анализируя динамику затрат живого и прошлого труда по мере рационалистического развития технологического 29.5 KB
  Анализируя динамику затрат живого и прошлого труда по мере рационалистического развития технологического процесса установлено что уменьшение суммы живого и прошлого труда происходит только до определенного предела. Дальнейшее увеличение затрат прошлого труда фактически не будет обеспечивать увеличение производительности труда а будет лишь увеличивать стоимость выпускаемой продукции и становится экономически нецелесообразным. Как определить этот предел эту границу переход к которой фактически будет означать топтание на месте даже при...
34303. Динамика развития реального технологического процесса 34 KB
  Динамика развития реального технологического процесса кривая ломанная линия Она описывает реальную динамику развития производительности от вооруженности. Точка 37 произошло изменение в развитии технологического процесса и прошел этап эвристического развития У увеличивается У1 до У2. Недостаток совершенного развития 24 дальше 45 резкое повышение производительности труда.
34304. Эволюционный путь развития технологических процессов 22.5 KB
  Эволюционный путь развития технологических процессов Использование в производстве рационалистических решений совершенствующих вспомогательные ходы технологического процесса представляет собой эволюционный путь его развития. Сущность технических решений обеспечивающих эволюционный путь развития технологических процессов заключается в замене движений человека на подобные движения механизмов на вспомогательных элементах процесса. На современном этапе развития техники практически любой вид движения возможно осуществить известными механизмами....
34305. Революционный путь развития технологических процессов 29 KB
  Революционный путь развития технологических процессов Использование в производстве эвристических технических решений совершенствующих рабочие ходы технологического процесса представляет собой революционный путь его развития. Во 2ом варианте после перехода на технологию с более высоким уровнем не происходит одновременного снижения затрат живого и прошлого труда на единицу продукции а даже возможно временное повышение их что казалось бы позволяет сделать вывод об отсутствии какоголибо развития но если проследить за дальнейшим эволюционным...