91650

Организация данных во внутримашинной сфере

Доклад

Информатика, кибернетика и программирование

Физическая организация данных определяет способ размещения информации непосредственно на машинных носителях и выполняется программными инструментариями автоматически без участия человека. Разработчики внутримашинной информационной базы АСУ оперируют в программах только представлениями о логической организации данных которая определяется видом модели данных. Под моделью данных понимается совокупность взаимосвязанных структур данных и операций над этими структурами.

Русский

2015-07-21

114.65 KB

0 чел.

Организация данных во внутримашинной сфере

Существует два уровня организации данных во внутримашинной сфере логический и физический. Физическая организация данных определяет способ размещения информации непосредственно на машинных носителях и выполняется программными инструментариями автоматически (без участия человека). Разработчики внутримашинной информационной базы АСУ оперируют в программах только представлениями о логической организации данных, которая определяется видом модели данных. Под моделью данных понимается совокупность взаимосвязанных структур данных и операций над этими структурами.

Вид модели и используемые в ней типы структур данных во многом предопределяют выбор системы управления базами данных или языка программирования, на котором создается прикладная программа обработки данных. Следует отметить, что для размещения одной и той же информации во внутримашинной сфере могут быть использованы различные структуры и модели данных. Их выбор возлагается на разработчиков информационной базы АСУ и зависит от многих факторов, в том числе от имеющегося технического и программного обеспечения, объемов информации, сложности задач АСУ.

В ряде случаев при организации данных во внутримашинной сфере применяют файловую модель. При такой модели внутри-машинная информационная база представляет собой множество не связанных между собой файлов из однотипных записей с одноуровневой структурой (рис.3.5). Запись является основной структурной единицей обработки данных и состоит из фиксированного набора (кортежа) полей, каждое из которых представляет собой элементарную единицу логической организации данных. Структура записи определяется составом и последовательностью входящих в нее полей.

Каждому экземпляру записи, как правило, в соответствие, ставятся один или два ключа записи: первичный (уникальный) и вторичный ключ. Первичный ключ это одно или несколько полей, однозначно идентифицирующих запись. В случае, если

первичный ключ состоит из одного поля, он называется простым, если из нескольких полей составным ключом. Вторичный ключ, в отличие от первичного, это такое поле, значение которого может повторяться в нескольких записях файла, то есть он не является уникальным. Если по значению первичного ключа может быть найден один единственный экземпляр записи, то по вторичному несколько.

Для ускорения доступа к записям файла выполняется процедура индексирования, результатом которой является создание дополнительного индексного файла, содержащего в упорядоченном виде все значения ключей файла данных. Для каждого значения ключа в индексном файле содержится указатель на соответствующую запись файла данных. Наличие индексного файла позволяет по заданному ключу быстро находить запись. Индексирование может производиться не только по первичному, но и по вторичному ключу.

Описание логической организации данных файловой модели заключается в присваивании каждому файлу уникального имени, а также в описании структуры его записей. При этом каждому полю задается сокращенное обозначение (имя поля) и указывается формат поля (тип хранимого данного, длина поля и точность

числовых данных). Для полей, выполняющих роль уникального (первого) ключа записи, указывается признак ключа. Структура файла обычно описывается таблицей, в которой отмечаются первичные и вторичные ключи.

Файловые информационные базы обрабатываются системами управления файлами (Q&A, Reflex, FFS File и др.), которые не считаются системами управления базами данных. Файловые системы легко осваиваются, достаточно просты и эффективны в использовании. Для работы с ними используются простые языки запросов, либо и вовсе ограничиваются набором программ-утилит. Такие системы обычно поддерживают работу с небольшим числом файлов, содержащих ограниченное число записей с небольшим количеством полей.

Кроме файловых моделей организации данных внутримашин-ной сферы существуют иерархические, сетевые и реляционные модели. Эти типы моделей являются более сложными и, в отличие от файловой организации данных, поддерживаются СУБД соответствующего типа. Различия между этими классами моделей постепенно стираются. Однако некоторые особенности перечисленных типов моделей следует отметить. Для иерархических и сетевых моделей их структура не может быть изменена после ввода данных, тогда как структура реляционных моделей может изменяться в любое время. С другой стороны, иерархические и сетевые модели обеспечивают более быстрый доступ к информации, чем реляционные модели.

Иерархические модели имеют древовидную структуру, когда каждому узлу структуры соответствует один сегмент, представляющий собой поименованный линейный кортеж данных. Каждому сегменту, кроме корневого, соответствует один входной и несколько выходных сегментов (рис. 3.6).

Каждый сегмент лежит на единственном иерархическом пути, начинающемся с корневого сегмента. При описании такой логической организации данных достаточно для каждого сегмента указать его входной сегмент. Так как в иерархической модели каждому входному сегменту данных соответствует N выходных, то такие модели весьма удобны для представления отношений типа 1.-L в предметной области.

 

Некоторым недостатком иерархических моделей является их неэффективность при реализации отношений типа L:L, медленный доступ к сегментам данных нижних уровней иерархии и четкая ориентация только на определенные типы запросов и др. В связи с этим в настоящее время СУБД, базирующиеся на иерархических моделях, подвергаются существенным модификациям, позволяющим поддерживать более сложные типы структур и, в первую очередь, сетевые их модификации.

Сетевая модель во многом подобна иерархической и отличается от нее только тем, что допускает несколько входных сегментов наряду с возможностью наличия сегментов без входов с точки зрения иерархической структуры. На рис. 3.7 представлен простой пример сетевой структуры, полученной на основе модификации иерархической топологии (рис. 3.6).

Графическое отображение структуры связей сегментов в такого типа моделей представляет собой сеть. Сегменты данных в сетевых базах данных могут иметь множественные связи с сегментами старшего уровня. В связи с тем, что в сетевых моделях имена и направление связей не так очевидны, как в иерархических моделях данных, они должны указываться при описания базы данных. В сетевых моделях данных любая запись старшего уровня может содержать данные, относящиеся к набору записей подчиненного уровня. Обращение к набору всех записей реализуется, начиная с записи старшего уровня. При этом нет


необходимости, как это выполняется в иерархических моделях, осуществлять доступ к искомому набору записей через корневой сегмент. Обращение к данным возможно с любой точки доступа по связям.

Сетевые модели данных по сравнению с иерархическими являются более универсальным средством отображения во внут-римашинной сфере структуры информации для разных предметных областей и это существенно расширяет сферу их применения. Достоинством сетевых моделей является отсутствие дублирования данных в различных элементах модели. Кроме того, технология работы с сетевыми моделями является более удобной, так как доступ к данным практически не имеет ограничений и возможен непосредственно к объекту любого уровня. Допустимы всевозможные запросы. Однако следует отметить, что ввиду сложности сетевых моделей, разработка СУБД на их основе предполагает использование опытных системных аналитиков и программистов. Кроме того, при использовании сетевых моделей более остро стоит проблема обеспечения сохранности информации в базе данных.

Реляционные модели данных отличаются от сетевых и иерархических простотой структур данных, удобным для пользователя табличным представлением и доступом к данным. Большинство современных баз данных в настоящее время разрабатывают

ются на основе моделей подобного типа. Реляционную модель представления информации предложил в 1970 г. сотрудник фирмы IBM Эдгар Кодд. Данная модель позволяет выполнять все необходимые операции по запоминанию и поиску данных и обеспечивает целостность данных.

Модель основана на математическом понятии отношения, расширенном за счет значительного добавления специальной терминологии и развития соответствующей теории. В такой модели общая структура данных (отношений) может быть представлена в виде таблицы, в которой каждая строка значений (кортеж) соответствуют логической записи, а заголовки столбцов являются названиями полей (элементов) записи. Процедуры запоминания и поиска осуществляются с применением операций на множествах (объединение, пересечение, разность, произведение) и реляционных операций (выбрать, спроецировать, соединить, разделить). Отметим, что хотя реляционная модель и выглядит как совокупность связанных таблиц, но на физическом уровне данные хранятся в файлах, содержащих последовательности записей.

В реляционной модели каждому объекту предметной области соответствует одно или более отношений. При необходимости связь между объектами можно указать в явном виде. В такой связи (отношении) в качестве атрибутов указываются идентификаторы взаимосвязанных объектов. В реляционной модели объекты предметной области и связи между ними представляются одинаковыми конструкциями, что существенно упрощает модель.

Суть реляционной модели можно пояснить на следующем примере. Пусть в базе данных строительного предприятия имеются два файла: а) справочник железобетонных изделий; б) отчет о поставках изделий (рис. 3.8). Каждый из этих файлов содержит определенное число записей, состоящих из фиксированного числа полей (соответственно 4 и 4).

В данном фрагменте базы данных определены два отношения (файла), имеющие общий элемент значения поля Изделие. Операции реляционной алгебры могут объединить два типа записей по этому общему элементу. Например, в результате соединения запись ПС может представиться в следующем виде:


 

А также другие работы, которые могут Вас заинтересовать

67774. Расчет требуемой степени очистки производственных стоков 74.37 KB
  Оценка требуемой очистки сточных вод СВ которая позволяет сделать обоснованный выбор типа и мощности очистных сооружений вариантов размещения оголовков выпуска у берега или в стрежень и их конструктивных особенностей. Участок водоема от места выпуска стоков условно делят на зоны: 1 начального разбавления...
67775. Преобразования Фурье 101.5 KB
  ДПФ определяет спектр дискретной периодичной функции x(t). ДПФ – обратимая операция отображения временных рядов в область частот. Свойства ДПФ аналогичны свойствам интегрального преобразования Фурье. ДПФ определяет линейчатый спектр периодичной дискретизации функции времени, а обратное дискретное...
67777. Изучение счетчика Гейгера-Мюллера 168.01 KB
  На рабочей точке рассчитать истинное количество частиц попавших в счетчик с учетом мертвого времени исходя из τ=104 сек. Каковы основные характеристики счетчиков числа частиц В чем отличие счетчиков Гейгера-Мюллера от других счетчиков Что называют счетной характеристикой счетчика...
67778. МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ИЗМЕРЕНИЙ 47.02 KB
  Цель работы: Ознакомиться со статистическим характером явлений, рассматриваемых в ядерной физике; изучить законы, которым подчиняется распределение случайных величин; классификацию случайных и систематических ошибок; конкретное приложения изученных закономерностей для оценки ошибок измерения.
67779. ОПРЕДЕЛЕНИЕ АКТИВНОСТИ ИСТОЧНИКОВ БЕТТА-ИЗЛУЧЕНИЯ 194.6 KB
  Вычислить по формуле 2 поправку ω учитывающую взаимное расположение счётчика и источника β частиц. Вычислить по формуле 4 поправку f учитывающую поглощение β частиц. Найти поправку q на отражение β частиц от подложки по графику рис. Взаимодействие β частиц с веществом.