19280

Структура информации и структура данных. Организация данных в документальных АИПС STAIRS и IRBIS

Лекция

Информатика, кибернетика и программирование

Лекция 12. Структура информации и структура данных. Организация данных в документальных АИПС STAIRS и IRBIS. Документоориентированная база данных Domino/Notes. Технологии поиска и обработки документальной информации. Уровневая модель представления информации в полнотекстовы...

Русский

2013-07-11

350.33 KB

58 чел.

Лекция 12.

Структура информации и структура данных. Организация данных в документальных АИПС STAIRS и IRBIS.   Документо-ориентированная база данных Domino/Notes.  Технологии поиска и обработки документальной информации.  Уровневая модель представления информации в полнотекстовых БД.  

Структура полнотекстовой БД.

Проектирование документальной ИС. Проектирование логической структуры документальной БД.

12.1. Структура информации и структура данных

При любом методе отображения предметной области в машинных базах данных в основе отображения лежит фиксация (кодирование) понятий и отношений между понятиями. Абстрактное понятие структуры ближе всего находится к так называемой концептуальной модели предметной среды и часто лежит в основе последней.

Понятие структуры используется на всех уровнях представления предметной области и реализуется как (Слайд 12.2):

  •  структура информации - схематичная форма представления сложных композиционных объектов и связей реальной ПрО, выделяемых как актуально необходимые для решения прикладных задач, в общем случае без учета того, будут ли для ее решения использованы средства программирования и вычислительные машины;
  •  структура данных - атрибутивная форма представления свойств и связей ПрО, ориентированная на выражение описания данных средствами формальных языков;
  •  структура записей –целесообразная (учитывающая особенности физической среды) реализация способов хранения данных и организации доступа к ним как на уровне отдельных записей, так и их элементов.

Структура является общепринятым и удобным инструментом, одинаково эффективно используемым как на уровне сознания человека при работе с абстрактными понятиями, так и на уровне логики машинных алгоритмов. Структура позволяет простыми способами свести многомерность содержательного описания к линейной последовательности записей. Именно это позволяет формализовать на общей понятийной основе взаимосвязь представлений информации в разных средах: обеспечить контролируемое сведение бесконечного разнообразия объектов и видов взаимосвязей реального мира к жестко детерминированному описанию –совокупности двоичных данных и машинно-ориентированных алгоритмов их обработки.

Выделение трех указанных видов структур имеет в некотором смысле принципиальный характер. Структура определяет алгоритм выборки отдельных элементов данных, но в то же время она отражает и особенности «технологии» организации и обработки информации, свойственные человеку в его повседневной деятельности.

Физически понятию структура соответствует запись данных. Запись –это упорядоченная в соответствии с характером взаимосвязей совокупность полей (элементов) данных, размещаемых в памяти в соответствии с их типом. Память, отводимая для хранения значения элемента данных (поле данных), должна выбираться в соответствии с диапазоном значений, которые может иметь этот элемент. Поскольку для выполнения операции присвоения значения элементу данных  необходимо сначала выделить память, для чего используются две схемы–статическая и динамическая. Для первой характерно выделение памяти до того, как реально появляются значения (обычно на этапе трансляции программы); для второй –в тот момент, когда программа во время исполнения получает конкретное значение. Кроме того, характер данных (тип данных) определяет способ представления и, соответственно, некоторое множество стандартных операций (примитивов).

Таким образом, информационная база ИС состоит из двух компонент:  

) коллекции записей собственно данных;

) описания этих данных —так называемых метаданных.

Данные отделены от описаний, но в то же время данные не могут использоваться без обращения к соответствующим описаниям. Такая конструкция обеспечивает возможность того, что данные могут использоваться (т. е. представляться) по-разному.

12.2. Организация данных в документальных информационных системах

Организация данных и механизмы поиска в базах данных документальных информационных систем, построены на тех же принципах, что и фактографические системы. Однако в физической реализации есть и существенные различия, которые обусловлены в первую очередь информационной природой элементов данных:

  1.  Запись базы данных –документ, который задается как набор в общем случае необязательных полей, для каждого из которых определены имя и тип. Допустимо большинство стандартных типов (так называемые «форматные» поля, задающие числовые, символьные и другие величины), а также текстовые. Текстовые поля имеют переменную длину и композиционную структуру, не имеющую прямых аналогов среди стандартных типов языков программирования: текстовое поле состоит из параграфов; параграф - из предложений; предложение - из слов. При этом идентифицируемым (адресуемым) элементом данных с точки зрения хранения будет поле, а с точки зрения поиска (атомарным семантически значимым) –слово.  Вследствие этого поисковые структуры строятся в виде инвертированных файлов.
  2.  Семантическая природа текстовых полей, представляющих смысл в основном на естественном языке, определяет необходимость учитывать важнейшие свойства используемых терминов: синонимию, полисемию, омонимию, контекстную обусловленность смысла отдельного слова и возможность выразить один смысл многими способами. Вследствие этого поисковые индексы могут быть отличны от соответствующих словоформ поля.

12.3. Организация данных в документальной  АИПС STAIRS

На слайде (Слайд 12.3) приведена примерная схема организации данных для представления и поиска информации диалоговой системы поиска документов STAIRS (Storage and Information Retrieval System), разработанной фирмой IBM в 70-х годах. Отметим, что такая структура характерна и для большинства современных АИПС.

Физическая структура БД рассматриваемой системы включает в себя четыре файла операционной системы:

- файл частотного словаря, устанавливающий соответствие между словом, встречающимся в БД, его кодом и частотой, используется при текстовом поиске;

- инверсный (инвертированный, обратный) список, содержащий для каждого слова БД список документов, его содержащих, используется при текстовом поиске;

- текстовый файл, содержащий собственно документы, используется при выдаче (просмотре) документов;

- прямой, последовательный файл, содержащий «собранные» в одну строку фиксированной длины форматные поля и список двухбайтовых кодов слов, находящихся в тексте данного документа. При необходимости в соответствующих местах находятся разделители сегментов и/или предложений. Файл используется при форматном поиске и при наличии в запросах конструкций SENT, SEGM, CTX.

На слайде (слайд 12.4) представлен словарь слов, в котором содержится перечень терминов, встречающихся в документах. Словарь содержит указатели на списки экземпляров каждого слова. Список экземпляров одного слова может содержать тысячи ссылок на документы, в которых встречается это слово. Если критерий отбора докумета содержит несколько слов, то осуществляется слияние соответствующих списков экземпляров

Ввиду значительных размеров словаря, его организация должна предусматривать наличие специального индекса, представленного матрицей пар знаков. Каждой паре знаков поставлен в соответствие указатель на блок словаря, содержащий группу слов, начинающихся с этих знаков. Знаками могут быть буквы, цифры, а также специальные символы. Группы слов в словаре имеют переменную длину. Первые два знака слов, содержащихся в словаре, отсутствуют, но они показаны на рисунке, чтобы облегчить понимание структуры файла.

Некоторые слова в словаре могут иметь одинаковый смысл; такие слова связаны с помощью специального указателя «синоним» (на рисунке связи данного типа показаны штриховыми стрелками).

Каждому слову поставлен в соответствие указатель на списки экземпляров, являющихся перечнем документов, в которых встречается данное слово. Каждый список экземпляров содержит заголовок, из которого можно узнать число экземпляров слова во всем файле документов, а также число документов, в которых это слово встречается.

Система присваивает каждому документу уникальный номер. Этот номер является внутрисистемным и не связан с номерами, по которым пользователь может получить данный документ где-нибудь вне системы. В списке экземпляров, соответствующем какому-либо слову, содержатся внутрисистемные номера всех документов, в которых оно встречается. Поисковый критерий может включать требование поиска всех документов, содержащих одновременно два специфических слова. Например, можно осуществлять поиск документа, в котором содержится как слово ORANGUTANG, так и слово OSTRICH. В этом случае система находит множество документов, содержащих первое слово, а затем множество документов, содержащих второе слово, и путем их пересечения определяет множество документов, содержащих как первое, так и второе слово.

На слайде (слайд 12.5) показан файл документов, каждому из которых система сама присваивает внутренний порядковый номер. Документы состоят из параграфов и текстов, причем тексты также пронумерованы. Каждому параграфу присвоен специальный код, определяющий его тип (например, заголовок, автор, аннотация и т. д.).

Внутрисистемный номер документа является ключом к индексу документов. Этот индекс содержит адреса соответствующих документов в памяти. В принципе эти адресные указатели можно хранить непосредственно в списке экземпляров, но это нецелесообразно, так как объем памяти, необходимый для хранения адреса, больше объема памяти, необходимого для хранения номера документа. Индекс документов содержит не только адреса, а также некоторые вспомогательные сведения о документах. К этим сведениям относятся внешний номер документа, признак удаления документа, указывающий, какие параграфы документа (или документ в целом) исключены из файла, а также уровень секретности.

В состав документов могут входить параграфы различных типов, поэтому пользователь может потребовать, чтобы заданное слово содержалось в названии документа, аннотации, введении или каком-либо конкретном параграфе. В критерии отбора можно указывать автора, место издания документа и дату издания. Независимо от содержания критерия отбора поиск документа осуществляется на уровне списка экземпляров без необходимости входа в файл документов.

12.4. Организация данных в документальной АИПС IRBIS

Логическая структура

База данных документальной ИПС IRBIS - это именованная совокупность массива документов и структурированных справочников, обеспечивающих эффективность поиска. Логическая структура БД документальной ИПС IRBIS представлена на слайде (слайд 12.6).

Документ базы данных как структурированная форма представления информации в общем случае определяется своим уникальным (в массиве документов БД) идентификатором и составом полей.

Поле как часть документа представляет собой однозначно идентифицируемый в информационном массиве фрагмент, для которого определены тип, имя и характер обработки.

Слово как фрагмент поля, выделяемый по некоторым формальным (заданным в схеме представления документа) правилам, является единицей информации в операциях поиска.

Схема базы данных (документа) определяет логическую связь именования, физического размещения и наполнения полей, образующих документ, а также стратегию поиска (при этом представление всех или отдельных документов БД может быть доопределено контекстно средствами разметки. Использование встраиваемых определений структуры позволяет ввести «самоопределяемые» форматы представления документов. Это обеспечивает практически неограниченную гибкость при организации хранения коллекций разнородных документов, хотя и создает проблемы согласованного использования материала из-за возможности различной интерпретации определений). Особенностью этой реализации является логическая независимость схемы. Для одной базы данных может быть определено несколько разных схем, причем они в принципе равноправны, и в то же время одна и та же схема может быть использована для определения документов в нескольких БД.

В схеме документ определяется совокупностью описаний отдельных полей, для каждого из которых задается:

- идентификация материала в базе данных, обеспечивающая пользователю доступ средствами документального поиска;

- представление материала при вводе и выводе (формат и длина поля, размещение и оформление материала при отображении и т. д.);

- спецификация стратегии документального поиска (прямое сканирование записей или использование инвертированных поисковых справочников). Для полей, специфицированных как ключевые, т. е. имеющих поисковые справочники, дополнительно определяются правила формирования дескрипторов (заданием списков символов-разделителей слов и списков стоп-слов).

Логически непрерывный массив документов БД в общем случае размещается в нескольких физических файлах, данные в которых связаны через указатель логического следования.

Справочник базы данных размещается отдельно от массива документов и имеет специализированную структуру (частотный словарь, алфавитный индекс и инвертированные списки). Поисковые справочники являются производным по отношению к массиву документов.

Физическая структура

В ИПС IRBIS используется следующая иерархия понятий, связанных с физической организацией информации (Слайд 12.7).

База данных —некоторый объем файлового физического пространства для размещения данных, принадлежащих одной логической базе.

Файлы БД. Каждая база данных состоит не менее чем из двух типов файлов –файлов данных и файлов инвертированных структур. Отдельный файл может принадлежать только одной базе данных.

Экстент. Пространство для хранения данных в БД выделяется блоками (экстентами) по 8 следующих друг за другом страниц размером 8Кбайт. Экстент является единицей выделения пространства.

Страница. Файлы делятся на страницы размером по 8 Кбайт каждая. Логический номер страницы складывается из номера файла и номера страницы в файле (в простейшем случае логический номер равен номеру страницы в файле). В рамках БД файлы нумеруются, начиная с 1, и так же нумеруются страницы в рамках файла.

Словарные инвертированные структуры БД хранятся в отдельной области и представлены тремя типами страниц:

  •  индексные страницы;
  •  страницы текстового представления словарных структур;
  •  страницы инвертированных списков.

Страницы. На странице всегда хранится однородная информация (Слайд 12.8). Все страницы имеют заголовок, в котором хранится общая информация, используемая ядром ИПС для работы со страницами всех типов:

  •  тип страницы;
  •  идентификатор (номер) страницы;
  •  идентификатор (номер) следующей страницы;
  •  идентификатор (номер) предыдущей страницы;
  •  число вхождений, размещенных на странице;
  •  длина фиксированной части вхождения.

Характер распределения пространства после заголовка зависит от типа страницы (Слайд 12.9).

Индексные страницы. Индексные страницы содержат указатели на страницы текстового представления словарных структур. Каждая индексная страница содержит подзаголовок, хранящий следующую информацию:

  •  число вхождений (указателей), размещенных на странице;
  •  номер первой страницы инвертированных списков для множества страниц текстового представления словарных структур, описываемых индексной страницей.

За подзаголовком следуют указатели фиксированной длины, идентифицирующие отдельные страницы текстового представления словарных структур. В составе указателя следующая информация:

  •  метка сегмента (для представления общего словаря в виде объединения непересекающихся подмножеств);
  •  буква (символ), с которой начинается первое слово на странице;
  •  идентификатор (номер страницы).

Страницы текстового представления словарных структур. После фиксированного заголовка на странице следует подзаголовок, представляющий хранящийся на текущей странице фрагмент общего словаря. В состав подзаголовка входят:

  •  метка сегмента (для представления общего словаря в виде объединения непересекающихся подмножеств);
  •  номер первой страницы инвертированных списков;
  •  количество страниц инвертированных списков (для всех словарных структур, размещенных на текущей странице);
  •  размер свободного пространства;
  •  начало первого слова на странице (первые 4 буквы);
  •  начало последнего слова на странице (первые 4 буквы).

За подзаголовком следует карта размещения словарных структур, где для каждого отдельного вхождения фиксируются:

  •  длина слова (текстового выражения словарной структуры);
  •  количество документов (или длина инвертированного списка для словарной структуры);
  •  идентификатор страницы инвертированных списков, содержащей инвертированный список словарной структуры (по крайней мере, его начало);
  •  смещение начала инвертированного списка от начала списка страницы в целом.

Отдельный элемент карты размещения словарных структур располагается на пространстве страницы параллельно с самим текстовым выражением словарной структуры (длина текстового выражения при этом не должна превышать размера страницы за вычетом заголовочных областей). Размещение текстового выражения осуществляется по правилам лексикографической упорядоченности в рамках помеченного подмножества общего словаря и физически реализуется на странице снизу вверх. Тем самым свободное пространство на странице всегда представляет собой непрерывную область.

Страницы инвертированных списков. После фиксированного заголовка на странице следует подзаголовок, представляющий фрагмент инвертированных списков для некоторого подмножества словарных структур общего словаря. В состав подзаголовка входят:

  •  метка сегмента (для представления общего словаря в виде объединения непересекающихся подмножеств);
  •  номер первой страницы текстового представления словарных структур (для текущей страницы инвертированных списков);
  •  количество страниц текстового представления словарных структур (которым соответствует текущая страница инвертированных списков);
  •  размер свободного пространства.

За подзаголовком размещаются идентификаторы (физические номера) документов инвертированного списка. Под каждый номер отводится область фиксированного размера (этот размер указывается в поле «длина фиксированной части вхождения» общего заголовка страницы).

12.5.  Документо-ориентированная база данных Domino/Notes

Основой единицей хранения информации в базе данных Lotus Domino/Notes является отдельный документ.

Структура документа Notes, представленная на слайде (Слайд 12.10), определяется формой, содержащей в себе набор полей различных типов.

Поля данных подразделяются на поля данных документа и поля данных Notes:

Среда Notes изначально проектировалась для работы со слабоструктурированной информацией. Это и предопределило структуру базы данных Notes. Отдельный документ не обязательно имеет все те же поля, что и остальные документы, под поле выделяется столько памяти, сколько это необходимо для хранения конкретных данных, поля в документы могут добавляться динамически по мере возникновения в них необходимости или изменений представления разработчиков и пользователей.

База данных Notes может хранить любые типы данных, начиная от простого текста, чисел, времени и даты, до форматированного текста, графических образов, звука, видео и произвольных данных, которые могут храниться в виде присоединенных объектов в своем «родном» формате.

Типы документов. Документы БД Notes могут иметь отношения друг к другу, как «родительский» и «дочерний» документ (Слайд 12.11). Например, если вы создали приложение для отслеживания внешних контактов, то родительским документом может быть описание организации, дочерними к нему –карточки сотрудников, следующим уровнем дочерних документов –отчеты о встречах с сотрудниками или письма и т. д. (до 32 уровней иерархии)

Полнотекстовый поиск. Lotus Notes поддерживает функцию полнотекстового поиска, которая позволяет пользователям индексировать документы Notes и проводить их поиск по запросам. Notes показывает документы, удовлетворяющие критериям поиска, либо в порядке степени их соответствия критерию, либо в заданном пользователем порядке.

Управление версиями. Lotus Notes содержит функцию управления версиями документа, которая отслеживает многочисленные изменения, вносимые в документ различными пользователями. Автоматическое управление версиями реализовано таким образом, что при каждом сеансе редактирования документ помечается либо как основной, либо как производный от оригинала (ответ). При этом изменения, внесенные в документ Notes одним пользователем, не затираются, когда другой пользователь сохраняет свои изменения в документе. Характер изменений иллюстрируется схемами, представленными на слайде (Слайд 12.12).

Функция управления версиями Notes является достаточно гибкой, ее можно модифицировать в соответствии с потребностями любой рабочей группы. Кроме того, пользователи имеют возможность добавлять дополнительные комментарии к оригиналу документа, работая с ним как с производным, т. е. не сохраняя оригинал повторно.

Ссылки на документы. Notes имеет средства поддержки гипертекста, т. е. каждый документ может содержать «ссылки» на другие документы в любой базе данных Notes или на документы в WWW.

12.6. Технологии поиска и обработки документальной информации

Основные функции документальных ИС –хранение и поиск документов. Но, как отмечалось в л.10, задачи поиска документальной информации принципиально отличаются от поиска фактографии. Если во втором случае система отбирает записи, в которых указанный атрибут имеет указанное значение (величину), то случае документального поиска мы оперируем лингвистическими переменными, значение (смысл) которых может изменяться в зависимости от контекста, а одни и те же документы (данные) для разных пользователей могут иметь разную действенность и даже разный смысл. Кроме того, если при поиске в документальных ресурсах мы не получаем нужную информацию, то это может быть либо в следствие некорректности запроса, либо из-за отсутствия в БД документа, удовлетворяющего нашей потребности. Поэтому функции поиска в ДИС обычно представлены достаточно широким спектром механизмов и интерфейсов поиска, что обеспечивает вариантность представления (выражения) запроса и «вариантность» отбора, когда за счет совместного использования ИПЯ разной различительной силы, а также механизмов поиска с критериями отбора разной жесткости мы имеем возможность расширить пространство поиска построением альтернативных выдач.

Эффективность информационного поиска определяется следующими факторами:

- свойством концентрации-рассеяния информации, предопределяющим априорную неполноту любого отдельного ИР –источника информации практически по любой теме. Любой ресурс всегда ориентирован не только тематически (по отраслям знаний) и на определенный вид информации (НТД, патенты, отчеты НИР и т. д.), но также имеет свои системы представления и средства доступа к информации;

- свойством эмерджентности информации, предполагающим множественность и комбинативность использования любого информационного сообщения;

- свойствами информационно-поисковой деятельности, зависящей как от характера задач ОД, так и от особенностей человека – его возможностей по восприятию и интерпретации найденных документов (информация может быть потенциально полезной, но актуально не воспринятой, например, по причине недостаточности знаний получившего её потребителя);

- свойствами вычислительной среды реализации АИПС, для которой характерна жесткость процедур и предопределенная ограниченность форм представления информации.

В целом процесс информационного поиска может быть представлен как итеративная цепочка операций, выполняемых в совокупной человеко-машинной среде (сознании человека и в вычислительной машине), последовательно снимающей неопределенности, обусловленные перечисленными ранее свойствами информации, и в итоге реализующей своеобразное преобразование информационной потребности в совокупность документов, содержание которых удовлетворяет эту потребность, т. е. информация найденных документов обеспечивает решение задачи ОД.

Укрупненный алгоритм итеративного процесса поиска информации представлен на слайде (Слайд 12.13).

Такой подход позволяет рассматривать процесс поиска как последовательное изменение состояний (этапов) взаимодействующих подсистем (человека и автоматизированной информационно-поисковой системы), направленное на локализацию (снятие) неопределенностей следующих видов:

  1.  неопределенности соотношения «известного/неизвестного» в предмете поиска (свойственна реальной ИП);
  2.  неопределенности системы характеристических признаков для структуризации предмета поиска (свойственна осознанной ИП);
  3.  лексической неопределенности, как фактора степени соответствия информационно-поискового языка естественнонаучному языку предметной области (свойственна выраженной ИП);
  4.  неопределенности критериев сравнения поисковых образов (адекватность формальных мер близости, реализованных в конкретных АИПС);
  5.  неопределенности интерпретации ПОДов (субъективность и неполнота реконструирования пользователем смысла найденных документов);
  6.  неопределенность тематического соответствия и степени полноты представления проблематики в данном ИР.

Причем, первые четыре вида неопределенности имеют информационную природу (преобразование форм представления информации), пятая характеризует поисковый аппарат АИПС, а шестая отражает когнитивные особенности человека –приемника и генератора информации. Последняя существенна в том случае, когда в используемом ресурсе не была найдена информация, полностью обеспечивающая решение задачи ОД, и потребителю необходимо принимать одно из следующих решений:

  1.  продолжить поиск в этом ресурсе в надежде на то, что удастся так реформулировать запрос, что он выведет на нужный «пласт» информации;
  2.  перейти в другой ресурс (например, когда любая формулировка запроса дает отрицательный результат);
  3.  прекратить поиск и заняться непосредственно решением задачи (когда становится понятно, что легче открыть заново, чем найти описание открытия).

Не являясь практически измеримыми величинами, эти параметры, тем не менее, позволяют обозначить характер изменения состояния сторон.

Поскольку разные типы поисковых задач имеют разные типы и степени неопределенности, достаточно очевидно, что «траектория» поиска ( циклы и число итераций) для каждого случая будет различным.

Технологии отбора документов 

Технологии формирования выдачи документов по отдельному ПОЗ, объединяют два процесса:

  •  процесс объявления (выражения, обозначения) пользователем информационной потребности;
  •  процесс построения выдачи –множества документов, генерируемых системой в ответ на поисковое требование пользователя.

Технология генерации выдачи полностью определяется рассмотренной во второй главе обобщенной архитектурой АИПС.

В этом смысле выделяются два класса систем: диалоговые и пакетные. В первом случае технология ориентирована на работу в реальном масштабе времени, а условие отбора по одному запросу соотносится со всеми поисковыми образами документов (если БД не имеет инвертированных массивов, являющихся избыточными по отношению к основному). При пакетной обработке запросов, предназначенной для использования в системе избирательного распределения информации, каждый поисковый образ документа (чаще всего при поступлении в систему) соотносится с поисковыми образами всех запросов.

Разнообразие технологий подготовки запроса, таким образом, в основном относится к диалоговым системам, обеспечивая (в той или иной степени) не только эффективность вхождения в базу, но и качество поиска в целом.

В контексте понятия «выражение запроса», как главного (основного) операционного объекта, можно определить три типа не взаимоисключающих технологии его спецификации:

  •  непосредственного набора булевоподобного выражения;
  •  формирования булевоподобного выражения с помощью «конструктора запросов», облегчающего использование словарей, имен полей и операторов структурно-логической связи;
  •  форматно-ориентированных форм генерации «запроса по образцу».

Механизмы отбора документальной информации

Механизмы отбора документов в результат поиска, зачастую отождествляемые с языком поиска, реализуются алгоритмами, в основе которых лежит какая-либо модификация вычисления булева выражения, соотносящего множество терминов запроса и множество терминов документов базы данных. К сожалению, системы редко информируют пользователя о применяемых механизмах и особенностях их использования.

Модификацией булевого поиска является взвешенный булев поиск. Запрос может формулироваться на ИПЯ, описанном выше, но выдача документов при этом будет ранжироваться в зависимости от степени близости запроса и документа.

Поиск «по сходству» (документы-аналоги, «Like this»). Наиболее простой моделью этого типа является линейная модель индексирования и поиска, когда близость документа и запроса рассматривается, например, как угол между векторами запроса и документа в многомерном пространстве терминов индексирования. В соответствии со значением меры близости происходит ранжирование документов при выдаче. В простейшем случае документ считается соответствующим запросу, если он содержит не обязательно все, а только часть терминов запроса в любом сочетании.

Пороговые модели. Перечисленные выше алгоритмы предполагают, что на конечном этапе поиска выборка найденных документов ранжируется. Но совершенно очевидно, что это приводит к ранжированию практически всего массива документов. Ранжировать целиком такие массивы на практике невозможно, поэтому применяются пороговые модели, которые задают пороговые значения для документов, выдаваемых пользователю.

Ïîèñê ñ êîððåêöèåé çàïðîñà ïî ðåëåâàíòíîñòè. Такой поиск является уже интерактивным итеративным процессом. После проведения первичного поиска с использованием какого–либо из вышеперечисленных методов пользователь отмечает в списке найденных документов истинно релевантные, т.е. соответствующие его информационной потребности, а не просто содержащие термины запроса. Некоторые системы имеют для этого специальное поле (область при документе), где пользователь может отметить документ как релевантный. При следующей итерации система уже сама расширяет запрос пользователя терминами из релевантных документов и снова выполняет поиск. Так продолжается до тех пор, пока пользователь не сочтет, что лучшего результата, чем он уже имеет, добиться не удастся. Здесь имеем два типа обратной связи. Для построения словников на основе лексики документов, определяемых пользователем как истинно релевантные, используется «внешняя» обратная связь. Для построения реформулированного запроса используется уже «внутренняя» обратная связь, позволяющая пользователю (непосредственно) или системе (ранжированием или кластеризацией по статистическим показателям) выделить семантически-значимые термины.

Этот простой и достаточно эффективный механизм, тем не менее, имеет особенность, требующую от пользователя сосредоточения только на одной цели (предмете) поиска. В том случае, если он при просмотре очередной итерации будет отмечать релевантными документы, которые ему интересны в контексте другой темы, это создаст для системы ситуацию “погони за двумя зайцами”.

Ïðèâåäåííûå ìåõàíèçìû ìîæíî îòíåñòè ê ýâðèñòè÷åñêèì â òîì ñìûñëå, ÷òî â ðезультате процесса поиска формируется одна или несколько документальных областей, в той или иной степени соответствующих потребности пользователя. Принципиальным моментом является то, что система таким образом готовит альтернативы, позволяя не только увеличить полноту поиска, но и выйти на новую лексику предметной области, неизвестную пользователю.

Постобработка поисковой выдачи

Основное назначение постобработки —снижение размерности пространства документов, которое необходимо «обработать» пользователю для получения уверенности в том, что полученная информация адекватна –полно и точно отражает состояние предметной области в аспекте задачи конкретного пользователя. Именно наличие конкретных особенностей содержания, формы представления или будущего использования информации позволяет предположить, что часть найденных формальными методами документов может заранее (до просмотра) считаться малозначимой, т.е. не обладающей существенными признаками. Соответственно, если множество найденных документов будет упорядочено в выдаче по убыванию значения этого признака, то пользователь достаточно просто, но обоснованно, может принять решение о завершении просмотра.  

Такое упорядочение (ранжирование) документов достаточно просто реализуется, если в качестве существенного признака выступает, например, «свежесть» публикации: для этого система отсортирует документы по значению поля «Дата публикации». Существенно сложнее процедура в случае ранжирования по степени смыслового соответствия. Сложность предопределяется двумя факторами. В-первых, системе достаточно трудно точно и однозначно установить действительный смысл реальной потребности пользователя по обычно очень короткому выражению запроса. Во-вторых, практически невозможно выбрать адекватную меру соответствия, поскольку она должна вычисляться по формальным количественным признакам, в то время как смысловое соответствие имеет качественный характер.

В технологиях информационного поиска используются две методики упорядочения. Первая –классификация, основана на сведении запроса к общепринятой (по крайней мере, в данной предметной области) системе классификации. Вторая - кластеризация, основана на предположении, что предметная область (и взгляды на нее) обладает свойством структурированности, и выданные документы могут быть разделены в соответствии с аспектами, один или несколько из которых, вероятно, будут соответствовать реальной потребности.

Классификация и кластеризация представляют собой две противоположные технологии: классификация заключается в автоматическом отнесении (определении тематики) документа к одному из классов, определенных на известном множестве признаков, в то время как задачей кластеризации является автоматическое построение классов семантически подобных документов. То есть, в случае классификации на первом этапе задается система признаков, определяющих фиксированное количество классов, а на втором –документы распределяются между этими классами. В случае кластеризации множество документов сразу разбивается на кластеры по степени близости признаков, которыми они обладают сами, т.е. происходит не столько выявление, облает ли документ признаками, заранее объявленными в классификационной системе, столько выявление признаков, которые могут быть объявлены (на втором этапе) в качестве классификационных.

Технологии обработки результатов поиска

Возможности АИПС по обработке результатов поиска можно рассматривать в следующих аспектах:

  •  управление формой представления документов и списков документов (оперативное изменение формата и наполнения, фрагментирование);
  •  управление последовательностью выдачи (сортировка, ранжирование, оперативные переходы с возвратами, «закладки»);
  •  локализация результата на уровне отдельного документа или совокупности (отметка степени соответствия информационной потребности);
  •  использование фрагмента документа, ссылки на документ или совокупность документов в последующих запросах, а также для развития процесса поиска;
  •  использование результатов поиска для оценки качества поиска.

Развитые средства обработки результатов поиска предопределяют возможность разработки средств и технологий автоматической или автоматизированной реформулировки запроса.

Методы ранжирования документов в выдаче основываются на использовании количественных мер, отражающих либо статистику встречаемости и взаимосвязи терминов в документах, либо статистику взаимосвязи  документа с другими документами в выборке или в предметной области.

Технологии управления поиском

Управление процессом поиска для диалоговых АИПС определяется:

  •  разнообразием операционных объектов и средств их обработки, определяющих возможные методы получения результата и особенности его представления;
  •  интерфейсными решениями (зависящими от архитектуры программно-технического комплекса), определяющими степень гибкости сценария и его управляемость как пользователем, так и системой.

Рассматривая поиск в контексте понятия «стратегия» и представляя его как динамический процесс с изменяющимися состояниями сторон диалога (пользователь –система), можно (хотя и очень условно) выделить три типа поисковых технологий:

  •  «запрос-ответ»,  как реализацию истинно вербальной стратегии;
  •  «накопления результата», когда система позволяет не только использовать ссылки на результаты отдельных поисков, но и получать сам результат способом, отличным от  запросно-ответного;
  •  «распространяющейся активности», позволяющую не только изменять способ получения результата, но и изменять цель –предмет поиска, обеспечивая как дифференцированное использование результатов, так и восстановление поисковой ситуации.

Естественное представление результатов поиска как множества документов также имеет свои особенности, связанные с постобработкой результата в циклическом поисковом процессе.

Во-первых, реализация отдельных механизмов поиска (поиск по совпадению терминов, поиск аналогов, поиск «похожих» документов, поиск с использованием обратной связи по релевантности) требует обязательного ранжирования выдачи (а иногда и усечения), так как применение этих механизмов приводит к выдачам большого объема. В этом случае средства представления и постобработки результата ориентируются на формальные методы ранжирования (в соответствии с конкретным механизмом поиска).

Во-вторых, для инициации новых поисковых циклов могут использоваться документы, полученные на очередном этапе поискового процесса. Использование лексики документа для формирования ПОЗ происходит либо путем альтернативного цветового выделения самих терминов внутри документа, либо путем формирования количественного запроса – требования на поиск документов, имеющих заявленное количество любых общих терминов с текущим. Здесь средства представления результата должны учитывать возможную постобработку, которая носит управляющий характер: материал каждого документа должен быть доступен для составления запроса и запуска поискового механизма.

И, наконец, в-третьих, каждый очередной этап поискового цикла должен в идеале пополнять для пользователя коллекцию документов, формируя тем самым персональную тематическую область. Это означает, что все полученные пользователем результаты должны быть ему доступны, по крайней мере, как множество документов. Эту задачу решает для пользователя такое средство представления результатов, как протокол поиска. Назначение такой метаинформационной структуры в первую очередь в том, чтобы предоставить (через лексику запроса) доступ к каждому из документов любого промежуточного результата (при этом протокол хранит и способ получения отдельного результата). Таким образом, ПОЗ становятся такими же элементами для составления запроса, как и термины частотного словаря, что делает возможным использование при очередном цикле поиска ранее полученных результатов.

Общая характеристика средств, технологий и механизмов поиска приведена на слайде (Слайд 12.14). При этом рассмотренная схема поиска отражает следующие требования к интерфейсным компонентам и организации процесса поиска в целом:

  •  подготовка следующего шага поиска выполняется непосредственно при обработке результата предыдущего: для развития поиска в качестве основного интерфейсного объекта в первую очередь используются документы;
  •  операционные объекты однородны на каждом шаге;
  •  на каждом шаге возможен возврат к ранее полученным результатам или оперативное переключение на другую тему и операцию;
  •  оценка степени завершенности (сходимости) процесса поиска возможна по критерию исчерпания как лексики, так и документального пространства темы.

Тем самым, классическая схема выдачи документов «по запросу-выражению» расширена до динамически управляемого процесса построения систематизированного пространства документов и терминов. При этом процесс поиска построен симметрично и реализует двойственную задачу: при подготовке запроса можно формировать коллекцию документов, а при формировании поисковой выдачи –реформулировать запрос и формировать компоненты лингвистического обеспечения.

12.7. Уровневая модель представления информации в полнотекстовых БД

Как отмечалось ранее, важнейшими особенностями информационных систем, основанных на концепциях БД являются:

  •  многоаспектность представления информации, в том числе основанная на наиболее часто используемом принципе разделения физического и логического представлений;
  •  многократность и многофункциональность обработки (использования для решения различных прикладных задач) однажды сохраненной (созданной) информации и, как следствие, необходимость обработки запросов, заранее (при создании БД) не предусмотренных.

Однако для документальных систем важен и другой фактор, влияющий на эффективность работы человека с информацией - это форма хранения и представления (оформление) документа. Это особенно заметно при работе с объемными полнотекстовыми документами, когда от выбора формата (DOC, PDF, HTML и т. д.) зависит возможность дальнейшей обработки.

Для определения способов представления информации в полнотекстовых БД рассмотрим соотношение основных функциональных аспектов (базовых типов операций) АИС. Схема, представленная на слайде (Слайд 12.15), отражает «перпендикулярность» функциональных направлений «поиск-выдача» и «ввод-запись-выборка», которые в организационно-функциональных решениях обычно выделяются в виде самостоятельных блоков. Здесь следует отметить, что в отличие от направления «поиск-выдача», подсистемы подготовки и ввода информации обычно организационно локализуются и включают в себя средства обработки ограниченного разнообразия, а функции хранения и выборки данных реализуются в одной среде –однажды выбранной СУБД.

По каждому из этих функциональных направлений физические и логические представления различны, и в самом общем случае для каждого взаимодействия с системой требуются отдельные (в том числе и специализированные) представления информации: формы ввода запроса отличаются от форм представления содержания найденных по этому запросу документов; формы документов, используемые на этапе ввода данных в систему, отличаются от формы хранения введенных данных.

Соответственно, система должна обеспечить согласованную обработку представлений, используемых взаимодействующими сторонами, т. е. форма поискового интерфейса должна согласовываться со структурой хранения и форматом выдачи документов.

И, как в случае уровневых схем теории баз данных, внешние представления должны определять семантику информационных объектов –свойства, атрибуты и характер последующего использования, а внутренние –типы данных и способы их идентификации.

Реально базы данных полнотекстовых документов не могут быть не гетерогенными, причем, в отличие от фактографических, полнотекстовым базам свойственна еще и разнородность физических представлений: документы, в силу разных причин, скорее всего, будут храниться в том формате, в каком они были получены. То есть «разнородность» надо рассматривать в следующих аспектах:

  1.  разнородность может проявляться как на уровне семантики (способов интерпретации величин), так и на структурно-форматном уровне (различных наборов и типов полей, образующих документ);
  2.  разнородность может быть свойственна всем документам БД или отдельным. То есть «типизация» может быть определена либо для некоторого идентифицируемого подмножества документов, либо своя структура должна быть определена для каждого документа (например, с хранением схемы вместе с содержанием документа);
  3.  для реализации разнородных БД может использоваться декларативный или процедурный способ определения структуры документа.

Преобразование представлений

Представление данных во многом определяет способы доступа к ним, возможности по преобразованию данных в другой формат с минимальными потерями содержания, а также оказывает значительное влияние на способы поиска и передачи данных. Логико-семантическая модель документальной информации должна учесть как «физический» аспект (многоуровневую вложенность разнородных компонентов), так и логику (семантику) использования информации - поиск документов по их вербальным и структурно-графическим компонентам, а также обеспечение навигации по документу.

Для полнотекстовых БД, для которых характерна разнородность как на уровне семантики, так и на физическом уровне, согласованность представлений может быть обеспечена связыванием информационного и метаинформационного компонентов.

В основу реализации процессов «декомпозиции-синтеза» данных положена трехуровневая система следующих базовых информационных компонентов (сюда относятся и «стандартные» операции разбора и загрузки документа как взаимосвязанной совокупности элементов данных, а также выборка и верстка функционально ориентированных документов, как совокупности семантически упорядоченных полей) (Слайд 12.16):

  •  элемент данных –величина, представляющая в машинной форме логическую (семантически значимую) единицу информации. Обычно представлена в вычислительной среде целостным физическим объектом и идентифицируется именем;
  •  поле данных –группа (последовательность) элементов данных, объединенных по какому-либо функциональному или семантическому признаку. Обычно представляет логически целостный объект, обеспечивающий полноту передачи контекстно-однородной информации;
  •  документ –структура, связывающая разнородные поля данных в соответствии с контекстом (или технологией) использования информации. Обеспечивает возможность адекватного восприятия содержания в целом: точность интерпретации значений полей, эффективность восприятия и понимания которых вне системы (обычно, человеком) обусловлена специфицируемой структурой документа - упорядоченной последовательностью соответствующим образом оформленного материала полей (версткой документа).

Такой подход, отражающий в первую очередь семантику использования информации в сфере основной деятельности, имеет в своей основе логику, подобную логике управления данными: документ является упорядоченной совокупностью элементов данных, которая формируется в соответствии со схемой - определением структуры, задаваемой статически или динамически. Причем, в том случае, когда документальная система реализуется в среде универсальной СУБД (например, реляционной), наибольшая гибкость представления данных достигается при двухуровневой схеме определения структуры документа: поля определяются как композиция элементов данных средствами языка СУБД, а документ - как композиция полей средствами, внешними по отношению к СУБД (это могут быть средства языка программирования прикладной программы или генератора отчетов).

Однако в практике создания документальных БД оптимальность такого подхода далеко не очевидна. Действительно, можно выделить несколько критериев оптимизации, практически не связанных друг с другом. К таким критериям можно отнести количество элементов во внутрисистемной и внешних структурах документа, время или иные ресурсы, затраченные на преобразование документа из внешнего во внутрисистемное представление и обратно. Выбор оптимального варианта модели в этом случае сводится к многокритериальной задаче.

12.8. Структура полнотекстовой БД

Исходя из ранее приведенных положений, для хранения полнотекстовых документов используется двухуровневая схема представления.

В качестве базового средства представления полнотекстовых документов принята объектная модель (DOM). При этом способы идентификации информационных элементов хранимых документов могут быть как контекстными (например, на основе XML), так и «декларативными» (традиционными для БД схемами). Принятие в качестве базовой DOM-модели позволяет использовать уже достаточно разнообразные языковые и программные средства, а также компоненты преобразования форматов, в том числе HTML, XML, RTF и т. д.  С другой стороны, использование поэлементного представления информации, свойственного базам данных, обеспечивает гибкость обработки и эффективность поиска.

Отдельная запись БД соответствует физическому документу, который может содержать несколько логических документов. Структура записи определяется физической схемой БД и включает метаинформационную и информационную составляющие.

Метаинформационный компонент содержит помимо обязательных идентификационных несколько необязательно явно указываемых значений:

  •  формат физического документа (текст, XML и т.д.);
  •  сведения о логической схеме документа (ссылка на схему);
  •  сведения о поисковых индексах.

Информационный компонент содержит материал документа и может быть представлен по-разному в зависимости от возможностей используемой СУБД (например, двоичным полем, объектом, связанной записью, агрегатом полей и т. д.).

Логический документ может быть идентифицируемой частью физического документа или композицией логических документов (динамический или «виртуальный» документ).

Структура документа может быть определена схемой документа отдельно от документа, или контекстно –поля документа и его структура могут быть определены, например, средствами XML внутри самого документа.

Исходя из требования запись-ориентированного доступа, определяемого архитектурой современных СУБД, можно определить два способа хранения полнотекстовых документов в базе данных (Слайд 12.17).

Во-первых, можно выделить все значения узлов XML-документа и вносить их в базу поэлементно в соответствии со схемой БД, т. е. значению XML-заголовка будет соответствовать имя поля, определенное в схеме БД. Однако в этом случае для документов, имеющих иерархическую структуру, возникают сложности при выдаче документа в первоначальном виде. Также проблемы могут возникать с сопоставлением имен полей и XML-заголовков (тэгов элементов).

Второй вариант –это хранение документа в виде «интегрального» массива, в данном случае в виде полноценного XML-документа. При этом возможность поэлементной выборки и обработки информации обеспечивается ассоциированной схемой базы данных, связывающей идентификацию полей в БД с элементами данных, определяемых XML-средствами.

Таким образом, в том случае, когда для хранения полнотекстовой информации используются БД, структура документов может быть определена двумя путями:

  1.  так же, как и для фактографических БД, заданием схемы –последовательности именованных типизированных полей данных;
  2.  контекстным определением –использованием специализированных языков разметки (например, HTML или XML), задающим индивидуальные особенности представления материала каждого документа.

Сюда относятся и «стандартные» операции разбора и загрузки документа как взаимосвязанной совокупности элементов данных, а также выборка и верстка функционально ориентированных документов, как совокупности семантически упорядоченных полей.

Использование встраиваемых определений структуры позволяет ввести «самоопределяемые» форматы представления документов. Это обеспечивает практически неограниченную гибкость при организации хранения коллекций разнородных документов, однако создает проблемы семантические согласованного использования материала (из-за возможности различной интерпретации определений), что в свою очередь требует создания доступного всем пользователям репозитория метаинформации –описаний природы и способов представления информации.

12.9. Проектирование документальной ИС.

Хотя, в отличие от фактографических ИС, для документальных ИС нет общепризнанных методик проектирования «технология» их создания имеет много общего. Поскольку и те и другие имеют в своей «информационной» основе базы данных, то необходимо выполнять физическое и даталогическое проектирование. А так как ИС всегда имеет целевое назначение в сфере основной деятельности человека, то необходим и анализ предметной области (инфологическое проектирование) –определение требований к составу и наполнению информационного массива, обеспечивающего эффективность решения целевых задач пользователя, а в ряде случаев (например, систем управления документооборотом) и функциональное моделирование.

Основными объектами проектирования ДИС являются её обеспечивающие компоненты, прежде всего –информационный фонд, лингвистическое, программное и математическое обеспечение.

Проектирование информационного фонда производится по результатам анализа характера информационных потребностей и включает:

- определение видов и форм представления информационных материалов;

- определение источников информации (комплектования);

- проектирование базы данных.

Проектирование лингвистического обеспечения производится исходя из требований, предъявляемых к качеству поиска информации и включает:

- выбор ИПЯ;

- выбор языка/языков индексирования, обеспечивающих необходимую полноту и точность представления содержания;

- выбор языков и протоколов передачи информации.

Отметим, что именно лингвистическое обеспечение выполняет роль «контекста» данных, хранящихся в информационной системе.

Проектирование программного и математического обеспечения обычно производится в случае необходимости специальной пред- или постобработки документов, например, лингвистического анализа текстов или статистической обработки выдачи.

Проектирование логической структуры документальной БД

Как и фактографические, документальные ИС используют многоуровневые модели предметной обрасти. Обычно документальная БД имеет явно или неявно специфицируемую глобальную и внешние схемы (view), а в случае разнородных и распределенных источников - и внутренние схемы. Рассмотрим основные компоненты схемы БД на примере АИПС IRBIS, которая определяет логическую связь внутренней и внешней идентификации (именования), а также стратегии поиска. В схеме документ определяется совокупностью описаний отдельных полей, для каждого из которых задается:

- внешний идентификатор поля, обеспечивающий пользователю доступ средствами документального поиска;

- внутренний идентификатор поля в базе данных, обеспечивающая пользователю доступ средствами документального поиска;

- представление материала при вводе и выводе (формат и длина поля, размещение и оформление материала при отображении и т. д.);

- спецификация стратегии документального поиска (прямое сканирование записей или использование инвертированных поисковых справочников). Для полей, специфицированных как ключевые, т. е. имеющих поисковые справочники, дополнительно определяются правила формирования дескрипторов (заданием списков символов-разделителей слов и списков стоп-слов).

Средствами схем может быть указана возможность динамического генерирования гипертекстовых ссылок для отдельных элементов указанных полей, например ссылки на документы от имени автора на другие его публикации.

Возможности и примеры проектирования документальных БД, в том числе на физическом уровне, более подробно представлены в лабораторной работе практикума.


 

А также другие работы, которые могут Вас заинтересовать

20916. Исследование тахогенераторов постоянного и переменного тока 980.5 KB
  Оборудование измерительные приборы и инструменты: лабораторная установка источники постоянного и переменного тока вольтметры тахометр магазины сопротивлений и конденсаторов. По роду тока тахогенераторы делятся на ТГ постоянного тока и ТГ переменного тока. Допустимая амплитудная погрешность может составлять единицы процентов; минимум фазовой погрешности – минимум изменения фазы выходного напряжения при изменении скорости вращения для ТГ переменного тока; симметричность выходной характеристики – неизменность ее крутизны при изменении...
20917. Исследование электрических гиромоторов 327 KB
  Совокупность ротора электропривода роторных опор называемых главными опорами гироскопа и элементов крепящих двигатель на раме гироскопа представляет собой гиромотор гиродвигатель. Кинетический момент равен произведению момента инерции ротора J на угловую скорость его вращения 2: H=J2 . Для получения максимально возможного момента инерции ротора в заданных габаритах гиромоторы выполняются по обращенной схеме. В отличие от обычного двигателя статор гиромотора размещается внутри охватывающего его ротора.
20918. Классификаторы, коды и технология их применения 117 KB
  Контрольное число контрольная цифра разновидность контрольной суммы добавляется обычно в конец длинных номеров с целью первичной проверки их правильности. Контрольное число чаще всего это либо последняя цифра суммы всех чисел номера либо результат другой математической операции над цифрами. Вычисляется контрольное число A как остаток от деления контрольной суммы на 11 3. Если контрольное число A больше 9 то результирующее контрольное число A вычисляется как остаток от деления A на 10 4.
20919. Организационно-экономическая сущность задачи 2.16 MB
  Для этого рассмотрим: внешние и внутренние связи подразделения для которого создается АИС; информационная взаимосвязь входной и выходной информации; способы отправки и доставки информации. Информационная взаимосвязь подразделений данного экономического объекта позволяет определить состав взаимосвязанных подразделений объекта и место подразделения для функционирования которого необходимо решение данной задачи. Пример отражения информационной взаимосвязи подразделений супермаркета и выделение конкретного подразделения в частности отдела...
20920. ДОСЛІДЖЕННЯ СХЕМ ПОРІВНЯННЯ НАПРУГ 452 KB
  На панелі Джерела натиснути відповідні кнопки вибору сигналу постійного струму і включити стенд. На панелі U вх натиснути кнопку Джер. 1 панелі Джерела встановити напруга на вході 1 компаратора рівне U вх = 3 В. На панелі натиснути кнопку Джер.
20921. ДОСЛІДЖЕННЯ РОБОТИ МУЛЬТИВІБРАТОРА 64.5 KB
  2 із зображенням мультивібратора рис. Визначити за допомогою осцилографа амплітуду частоту і шпаруватість сигналу на виході мультивібратора. Часові діаграми роботи мультивібратора показані на рис.
20922. ДОСЛІДЖЕННЯ ІНТЕГРАТОРА 184 KB
  Експериментальне визначення перехідних характеристик інтегратора рис. Натисніть кнопку 20 сек панелі і кнопку С1 Інтегратор відлічуючи по секундоміру стенду час за допомогою U вих виконайте вимірювання зміни в часі вихідної напруги інтегратора. побудуйте перехідні характеристики інтегратора.
20923. ДОСЛІДЖЕННЯ ЕЛЕМЕНТІВ, ЩО ВИКОНУЮТЬ ЛОГІЧНІ ОПЕРАЦІЇ 105.5 KB
  Мета роботи: ознайомитися з принципом і режимом роботи логічних елементів. При виконанні роботи визначаються передавальні характеристики логічного елементу при різних опорах навантаження а також складаються таблиці станів для логічних елементів €œІ€ €œНІ€ €АБО€ €АБОНІ€ €ІНІ€. Визначення передавальних характеристик логічних елементів рис. Складання таблиць істинності логічних елементів.
20924. ДОСЛІДЖЕННЯ ТРИГЕРІВ 241 KB
  При виконанні цієї роботи вивчається дія асинхронного RSтригера а також двох синхронних: Ттригера і JКтригера Порядок виконання роботи Робота виконується на лабораторному стенді ЭС21. Дослідження RS тригера рис. З'єднати входи R і S тригера з клемами панелі Рівень логічний. З'єднати прямий вихід тригера з клемами вольтметра що вимірює вихідний сигнал.