70613

Моделирование данных

Лекция

Информатика, кибернетика и программирование

Каждый экземпляр сущности должен однозначно идентифицироваться и отличаться от всех других экземпляров данного типа сущности. Каждая сущность должна обладать некоторыми свойствами: иметь уникальное имя; к одному и тому же имени должна всегда применяться одна и та же интерпретация...

Русский

2014-10-23

54.59 KB

0 чел.

Лекция 36

Моделирование данных

Одной из основных частей информационного обеспечения является информационная база. Как было определено выше (см. лекцию 9), информационная база (ИБ) представляет собой совокупность данных, организованную определенным способом и хранимую в памяти вычислительной системы в виде файлов, с помощью которых удовлетворяются информационные потребности управленческих процессов и решаемых задач. Разработка БД выполняется с помощью моделирования данных. Цель моделирования данных состоит в обеспечении разработчика ИС концептуальной схемой базы данных в форме одной модели или нескольких локальных моделей, которые относительно легко могут быть отображены в любую систему баз данных. Наиболее распространенным средством моделирования данных являются диаграммы "сущность-связь" (ERD). С помощью ERD осуществляется детализация накопителей данных DFD – диаграммы, а также документируются информационные аспекты бизнес-системы, включая идентификацию объектов, важных для предметной области ( сущностей ), свойств этих объектов ( атрибутов ) и их связей с другими объектами (отношений).

Базовые понятия ERD

Сущность (Entity) — множество экземпляров реальных или абстрактных объектов (людей, событий, состояний, идей, предметов и др.), обладающих общими атрибутами или характеристиками. Любой объект системы может быть представлен только одной сущностью, которая должна быть уникально идентифицирована. При этом имя сущности должно отражать тип или класс объекта, а не его конкретный экземпляр (например, АЭРОПОРТ, а не ВНУКОВО).

Каждая сущность должна обладать уникальным идентификатором. Каждый экземпляр сущности должен однозначно идентифицироваться и отличаться от всех других экземпляров данного типа сущности. Каждая сущность должна обладать некоторыми свойствами:

  1.  иметь уникальное имя; к одному и тому же имени должна всегда применяться одна и та же интерпретация; одна и та же интерпретация не может применяться к различным именам, если только они не являются псевдонимами;
  2.  иметь один или несколько атрибутов, которые либо принадлежат сущности, либо наследуются через связь ;
  3.  иметь один или несколько атрибутов, которые однозначно идентифицируют каждый экземпляр сущности.

Каждая сущность может обладать любым количеством связей с другими сущностями модели.

Связь (Relationship) — поименованная ассоциация между двумя сущностями, значимая для рассматриваемой предметной области. Связь — это ассоциация между сущностями, при которой каждый экземпляр одной сущности ассоциирован с произвольным (в том числе нулевым) количеством экземпляров второй сущности, и наоборот.

Атрибут (Attribute) — любая характеристика сущности, значимая для рассматриваемой предметной области и предназначенная для квалификации, идентификации, классификации, количественной характеристики или выражения состояния сущности . Атрибут представляет тип характеристик или свойств, ассоциированных с множеством реальных или абстрактных объектов (людей, мест, событий, состояний, идей, предметов и т.д.). Экземпляр атрибута — это определенная характеристика отдельного элемента множества. Экземпляр атрибута определяется типом характеристики и ее значением, называемым значением атрибута. На диаграмме "сущность-связь" атрибуты ассоциируются с конкретными сущностями. Таким образом, экземпляр сущности должен обладать единственным определенным значением для ассоциированного атрибута.

Метод IDEFI

Наиболее распространенными методами для построения ERD-диаграмм являются метод Баркера и метод IDEFI.

Метод Баркера основан на нотации, предложенной автором, и используется в case-средстве Oracle Designer.

Метод IDEFI основан на подходе Чена и позволяет построить модель данных, эквивалентную реляционной модели в третьей нормальной форме. На основе совершенствования метода IDEFI создана его новая версия — метод IDEFIX, разработанный с учетом таких требований, как простота для изучения и возможность автоматизации. IDEFIX-диаграммы используются в ряде распространенных CASE-средств (в частности, ERwin, Design/IDEF).

В методе IDEFIX сущность является независимой от идентификаторов или просто независимой, если каждый экземпляр сущности может быть однозначно идентифицирован без определения его отношений с другими сущностями. Сущность называется зависимой от идентификаторов или просто зависимой, если однозначная идентификация экземпляра сущности зависит от его отношения к другой сущности (рис. 10.1, 10.2).


Рис. 10.1. Независимые от идентификации сущности


Рис. 10.2. Зависимые от идентификации сущности

Каждой сущности присваиваются уникальные имя и номер, разделяемые косой чертой "/" и помещаемые над блоком.

Связь может дополнительно определяться с помощью указания степени или мощности (количества экземпляров сущности-потомка, которое может порождать каждый экземпляр сущности-родителя). В IDEFIX могут быть выражены следующие мощности связей:

  1.  каждый экземпляр сущности-родителя может иметь ноль, один или более одного связанного с ним экземпляра сущности-потомка;
  2.  каждый экземпляр сущности-родителя должен иметь не менее одного связанного с ним экземпляра сущности-потомка;
  3.  каждый экземпляр сущности-родителя должен иметь не более одного связанного с ним экземпляра сущности-потомка;
  4.  каждый экземпляр сущности-родителя связан с некоторым фиксированным числом экземпляров сущности-потомка.

Если экземпляр сущности-потомка однозначно определяется своей связью с сущностью-родителем, то связь называется идентифицирующей, в противном случае — неидентифицирующей.

Связь изображается линией, проводимой между сущностью-родителем и сущностью-потомком, с точкой на конце линии у сущности-потомка (рис. 10.3). Мощность связей может принимать следующие значения: N — ноль, один или более, Z — ноль или один, Р — один или более. По умолчанию мощность связей принимается равной N.


Рис. 10.3. Графическое изображение мощности связи

Идентифицирующая связь между сущностью-родителем и сущностью-потомком изображается сплошной линией. Сущность-потомок в идентифицирующей связи является зависимой от идентификатора сущностью. Сущность-родитель в идентифицирующей связи может быть как независимой, так и зависимой от идентификатора сущностью (это определяется ее связями с другими сущностями ).

Пунктирная линия изображает неидентифицирующую связь (рис. 10.4). Сущность-потомок в неидентифицирующей связи будет независимой от идентификатора, если она не является также сущностью-потомком в какой-либо идентифицирующей связи.

Атрибуты изображаются в виде списка имен внутри блока сущности. Атрибуты, определяющие первичный ключ, размещаются наверху списка и отделяются от других атрибутов горизонтальной чертой (рис. 10.4 ).

Сущности могут иметь также внешние ключи (Foreign Key), которые могут использоваться в качестве части или целого первичного ключа или неключевого атрибута. Для обозначения внешнего ключа внутрь блока сущности помещают имена атрибутов, после которых следуют буквы FK в скобках (рис. 10.4).


Рис. 10.4. Неидентифицирующая связь


 

А также другие работы, которые могут Вас заинтересовать

26175. ПАРАМЕТАБОЛИЗМ 130 KB
  Ферментативное взаимодействие белков с углеводами наблюдается в норме в результате чего образуются сложные белки – гликопротеины. Интенсивно гликируются как правило альбумины и глобулины – эти белки плазмы крови содержат много фруктозоамина а также белки находящиеся в инсулиннезависимых тканях. Это коллаген кристаллины белки хрусталика глаза некоторые другие белки. Долгоживущие белки также подвергаются карбомоилированию с последствиями характерными для сахарного диабета например катаракта.
26176. Соединительная ткань. Межклеточное вещество 71.5 KB
  оединительная ткань составляет до 50% массы человеческого организма. Это связующее звено между всеми тканями организма. Различают 3 вида соединительной ткани. Соединительная ткань может выполнять как самостоятельные функции, так и входить в качестве прослоек в другие ткани
26178. СТРОЕНИЕ И СВОЙСТВА БЕЛКОВ 1.8 MB
  Но встречаются и молекулы содержащие от 10 до 100 аминокислот – они относятся к группе небольших ПОЛИПЕПТИДОВ крупные же полипептиды могут содержать и более 100 аминокислот. Следовательно все эти 20 аминокислот имеют совершенно одинаковый фрагмент молекулы. Молекулы воды структурированы и образуют кластеры. В эти кластерные структуры хорошо встраиваются молекулы которые сами являются полярными потому что полярные вещества хорошо растворимы в воде.
26181. Химия и обмен нуклеиновых кислот 141.5 KB
  Биологическая роль нуклеиновых кислот. ДНК: хранение генетической информации. Катаболизм нуклеиновых кислот. Различия в катаболизме пуриновых и пиримидиновых азотистых оснований. Реакции реутилизации аденина и гуанина, которые образуются при распаде нуклеиновых кислот...
26183. Особенности инженерно-геологических методов применительно к задачам исследования (изысканий) 6.29 MB
  Моделирование и расчеты напряженного состояния массивов для прогноза его поведения под воздействием сооружения; Инженерно-геологическая документация, наблюдения и опробование разрезов (отбор монолитов), бурение скважин или других горных выработок, гидрогеологические наблюдения; Пенетрационно-каротажные работы по изучению разрезов и свойств песчаных и глинистых отложений; Определение фильтрационных параметров водоносных горизонтов. Гидравлическое опробование с целью изучения трещиноватости, водопроницаемости и суффозионной устойчивости массивов горных пород;