40124

Реляционная модель данных. Теория нормализации. Нормальные формы: первая, вторая, третья, Бойса-Кодда

Доклад

Менеджмент, консалтинг и предпринимательство

Реляционная модель данных отличается удобным для пользователя табличным представлением и доступом к данным. В реляционной модели достигается гораздо более высокий уровень абстракции данных чем в иерархической или сетевой. К числу достоинств реляционного подхода можно отнести: наличие небольшого набора абстракций которые позволяют сравнительно просто моделировать большую часть распространенных предметных областей и допускают точные формальные определения оставаясь интуитивно понятными; наличие простого и в то же время мощного...

Русский

2013-10-15

50 KB

32 чел.

  1.  Реляционная модель данных. Теория нормализации. Нормальные формы: первая, вторая, третья, Бойса-Кодда.

Реляционная модель данных отличается удобным для пользователя табличным представлением и доступом к данным. Она является совокупностью простейших двумерных таблиц – отношений. В реляционной модели достигается гораздо более высокий уровень абстракции данных, чем в иерархической или сетевой. Это обеспечивается за счет использования математической теории отношений (реляционная алгебра).

К числу достоинств реляционного подхода можно отнести:

– наличие небольшого набора абстракций, которые позволяют сравнительно просто моделировать большую часть распространенных предметных областей и допускают точные формальные определения, оставаясь интуитивно понятными;

– наличие простого и в то же время мощного математического аппарата, опирающегося главным образом на теорию множеств и математическую логику и обеспечивающего теоретический базис реляционного подхода к организации баз данных;

– возможность ненавигационного манипулирования данными без необходимости знания конкретной физической организации баз данных во внешней памяти.

К недостаткам:

Сама реляционная модель ограничена в представлении данных:

  •  Реляционная модель данных не допускает естественного представления данных со сложной (иерархической) структурой, поскольку в ее рамках возможно моделирование лишь с помощью плоских отношений (таблиц). Все отношения принадлежат одному уровню, многие значимые связи между данными либо теряются, либо их поддержку приходится осуществлять в рамках конкретной прикладной программы.
  •  По определению в реляционной модели поля кортежа могут содержать лишь атомарные (неделимые) значения. Однако, в таких приложениях как САПР (системы автоматизироваанного проектирования), ГИС (геоинформационные системы), искусственный интеллект системы оперируют со сложно - структурированными объектами. Кроме того, даже в том случае, когда сложный объект удается "уложить" в реляционную базу данных, его данные распределяются, как правило, по многим таблицам. Соответственно, извлечение каждого такого объекта требует выполнения многих операций соединения (join), что значительно замедляет работу СУБД.

Обойти это и предыдущее ограничения можно было бы в том случае, если бы реляционная модель допускала

  •  возможность определения новых типов данных
  •  определение наборов операций, связанных с данными определенного типа

Реляционная модель состоит из трех частей, описывающих разные аспекты реляционного подхода: структурной части, манипуляционной части и целостной части.

В структурной части модели фиксируется, что единственной структурой данных, используемой в реляционных БД, является нормализованное n-арное отношение (арность отношения – его мощность или совокупность кортежей).

В манипуляционной части модели утверждаются два фундаментальных механизма манипулирования реляционными БД - реляционная алгебра и реляционное исчисление. Первый механизм базируется в основном на классической теории множеств (с некоторыми уточнениями), а второй - на классическом логическом аппарате, указывающий лишь характеристики результирующего отношения, но ничего не говорит о способе его формирования.

В целостной части реляционной модели данных фиксируются два базовых требования целостности, которые должны поддерживаться в любой реляционной СУБД. Первое требование называется требованием целостности сущностей. Объекту или сущности реального мира в реляционных БД соответствуют кортежи отношений. Конкретно требование состоит в том, что любой кортеж любого отношения отличим от любого другого кортежа этого отношения, т.е. другими словами, любое отношение должно обладать первичным ключом. Требование целостности по ссылкам, или требование внешнего ключа состоит в том, что для каждого значения внешнего ключа, появляющегося в ссылающемся отношении, в отношении, на которое ведет ссылка, должен найтись кортеж с таким же значением первичного ключа, либо значение внешнего ключа должно быть неопределенным (т.е. ни на что не указывать).

Ключ – поле, каждое значение которого однозначно определено соответствующей записью.

Составной ключ – совокупность полей, значение которых однозначно определено соответствующей записью.

Неключевой атрибут - любой атрибут отношения, не входящий в состав первичного ключа.

Функциональная зависимость. Если даны два атрибута X и Y некоторого отношения, то говорят, что Y функционально зависит от X, если в любой момент времени каждому значению X соответствует ровно одно значение Y. Функциональная зависимость в базе данных и в математическом отличается тем, что в  БД нестатические, т.е. может   изменяться значение ключа, а зависимость остается.

Избыточная функциональная зависимость - зависимость, заключающая в себе такую информацию, которая может быть получена на основе других зависимостей, имеющихся в базе данных. Корректной считается такая схема базы данных, в которой отсутствуют избыточные функциональные зависимости. В противном случае приходится прибегать к процедуре декомпозиции (разложения) имеющегося множества отношений.

Полная функциональная зависимость – когда каждый не ключевой атрибут функционально зависит от ключа, не состоит в функциональной зависимости ни от какой части составного ключа.

Транзитивная функциональная зависимость – функциональная зависимость R.X -> R.Y называется транзитивной, если существует такой атрибут Z, что имеются функциональные зависимости R.X -> R.Z и R.Z -> R.Y и отсутствует функциональная зависимость R.Z --> R.X. (При отсутствии последнего требования мы имели бы "неинтересные" транзитивные зависимости в любом отношении, обладающем несколькими ключами.)

Взаимно независимые атрибуты. Два или более атрибута взаимно независимы, если ни один из этих атрибутов не является функционально зависимым от других.

Детерминант – любой атрибут, от которого полностью функционально зависит некоторый другой атрибут.

Нормализация отношений – формальный аппарат ограничений на формирование отношений, который позволяет устранить дублирование данных, обеспечивает их не противоречивость, уменьшает трудозатраты на сопровождение (устранение избыточной зависимости).

Нормализация нужна для того чтобы все отношения адекватно представляли предметную область, учитывая целостность данных и связей.

В теории реляционных баз данных обычно выделяется следующая последовательность нормальных форм:

  •  первая нормальная форма (1NF);
  •  вторая нормальная форма (2NF);
  •  третья нормальная форма (3NF);
  •  нормальная форма Бойса-Кодда (BCNF);

Основные свойства нормальных форм:

  •  каждая следующая нормальная форма в некотором смысле лучше предыдущей;
  •  при переходе к следующей нормальной форме свойства предыдущих нормальных свойств сохраняются.

В основе процесса проектирования лежит метод нормализации, декомпозиция отношения, находящегося в предыдущей нормальной форме, в два или более отношения, удовлетворяющих требованиям следующей нормальной формы.

Наиболее важные на практике нормальные формы отношений основываются на фундаментальном в теории реляционных баз данных понятии функциональной зависимости. Для дальнейшего изложения нам потребуются несколько определений.

1NF. Первая нормальная форма. Отношение, где все атрибуты (поля) простые и далее не делимы. Как правило исходная таблицу уже находиться в 1NF.

2NF. Вторая нормальная форма (в этом определении предполагается, что единственным ключом отношения является первичный ключ) Отношение R находится во второй нормальной форме (2NF) в том и только в том случае, когда находится в 1NF, и каждый неключевой атрибут полностью зависит от первичного ключа (или от каждого ключа, в случае составного ключа).

3NF. Третья нормальная форма. (Снова определение дается в предположении существования единственного ключа.) Отношение R находится в третьей нормальной форме (3NF) в том и только в том случае, если находится в 2NF и каждый неключевой атрибут нетранзитивно зависит от первичного ключа (или от какого-либо ключа, в случае составного ключа).

На практике третья нормальная форма схем отношений достаточна в большинстве случаев, и приведением к третьей нормальной форме процесс проектирования реляционной базы данных обычно заканчивается. Однако иногда полезно продолжить процесс нормализации.

BCNF. Нормальная форма Бойса-Кодда. Отношение R находится в нормальной форме Бойса-Кодда (BCNF) в том и только в том случае, если каждый детерминант является возможным ключом.

Очевидно, что это требование не выполнено для отношения СОТРУДНИКИ-ПРОЕКТЫ. Можно произвести его декомпозицию к отношениям СОТРУДНИКИ и СОТРУДНИКИ-ПРОЕКТЫ:

СОТРУДНИКИ (СОТР_НОМЕР, СОТР_ИМЯ)

Возможные ключи:

СОТР_НОМЕР

СОТР_ИМЯ

Функциональные зависимости:

СОТР_НОМЕР -> CОТР_ИМЯ

СОТР_ИМЯ -> СОТР_НОМЕР

СОТРУДНИКИ-ПРОЕКТЫ (СОТР_НОМЕР, ПРО_НОМЕР, СОТР_ЗАДАН)

Возможный ключ:

СОТР_НОМЕР, ПРО_НОМЕР

Функциональные зависимости:

СОТР_НОМЕР, ПРО_НОМЕР -> CОТР_ЗАДАН

Возможна альтернативная декомпозиция, если выбрать за основу СОТР_ИМЯ. В обоих случаях получаемые отношения СОТРУДНИКИ и СОТРУДНИКИ-ПРОЕКТЫ находятся в BCNF, и им не свойственны отмеченные аномалии.


 

А также другие работы, которые могут Вас заинтересовать

81442. Обмен веществ: питание, метаболизм и выделение продуктов метаболизма. Органические и минеральные компоненты пищи. Основные и минорные компоненты 112.57 KB
  Но она является незаменимым элементом в пище людей которые нуждаются во внешних источниках аскорбиновой кислоты известной как витамин C в контексте питания. гипервитаминоза. Дважды Нобелевскийлауреат Лайнус Полинг о витамине B3 известном также как ниацин и ниацинамид както сказал: Меня ошеломила его очень низкая токсичность при том что он оказывает такое значительное физиологическое влияние. Витамины биотин витамин B7 витамин H холин витамин Bp фолат фолиевая кислота витамин B9 витамин M ниацин витамин B3 витамин...
81443. Основные пищевые вещества: углеводы, жиры, белки, суточная потребность, переваривание; частичная взаимозаменяемость при питании 107.95 KB
  Углеводы выполняют структурную функцию то есть участвуют в построении различных клеточных структур выполняют пластическую функцию хранятся в виде запаса питательных веществ а также входят в состав сложных молекул. Углеводы являются основным энергетическим материалом. Углеводы участвуют в обеспечении осмотического давления и осморегуляции.
81444. Незаменимые компоненты основных пищевых веществ. Незаменимые аминокислоты; пищевая ценность различных пищевых белков. Линолевая кислота - незаменимая жирная кислота 109.43 KB
  Как было показано выше основным источником аминокислот для клеток организма являются белки пищи. Белки не являются незаменимыми пищевыми факторами они являются источниками содержащихся в них незаменимых аминокислот необходимых для нормального питания. Белки значительно различаются по аминокислотному составу. Растительные белки особенно пшеницы и других злаковых полностью не перевариваются так как защищены оболочкой состоящей из целлюлозы и других полисахаридов которые не гидролизуются пищеварительными ферментами.
81445. История открытия и изучения витаминов. Классификация витаминов. Функции витаминов 110.79 KB
  Классификация витаминов. Функции витаминов. Ныне известно что куриная слепота может вызываться недостатком витамина .
81446. Алиментарные и вторичные авитаминозы и гиповитаминозы. Гипервитаминозы 107.12 KB
  С нарушением поступления витаминов в организм связаны 3 принципиальных патологических состояния: недостаток витамина гиповитаминоз отсутствие витамина авитаминоз и избыток витамина гипервитаминоз. Примеры авитаминозов: Авитаминоз С Цинга недостаток витамина C приводит к нарушению синтеза коллагена соединительная ткань теряет свою прочность. Авитаминоз D Рахит специфическая функция витамина D заключается в регуляции процессов всасывания кальция фосфора в кишечнике и отложения их в костную ткань а также реабсорбции кальция и...
81447. Минеральные вещества пищи. Региональные патологии, связанные с недостаточностью микроэлементов в пище и воде 104.17 KB
  В настоящее время 14 микроэлементов признаны необходимыми для жизнедеятельности: железо медь марганец цинк кобальт йод фтор хром молибден ванадий никель стронций кремний селен. При его недостатке часто возникают боли в суставах которые иногда ошибочно принимают за проявления ревматизма ЖЕЛЕЗО FeНедостаток железа в питании может вызвать анемию малокровие. В сочетании с белком железо образует красящее вещество крови гемоглобин а так как процесс распада и образования кровяных телец непрерывен то железо должно поступать в...
81448. Понятие о метаболизме и метаболических путях. Ферменты и метаболизм. Понятие о регуляции метаболизма. Основные конечные продукты метаболизма у человека 105.69 KB
  Обычно в метаболических путях есть ключевые ферменты благодаря которым происходит регуляция скорости всего пути. Регуляция количества молекул фермента в клетке Известно что белки в клетке постоянно обновляются. Регуляция синтеза белка может происходить на любой стадии формирования белковой молекулы. Что касается распада ферментов то регуляция этого процесса менее изучена.
81449. Исследования на целых организмах, органах, срезах тканей, гомогенатах, субклеточных структурах и на молекулярном уровне 104.98 KB
  в биохимии всё шире применяются методы молекулярной и клеточной биологии в особенности искусственная экспрессия и нокаут генов в модельных клетках и целых организмах см. Определение структуры всей геномной ДНК человека выявило приблизительно столько же ранее неизвестных генов и их неизученных продуктов сколько уже было известно к началу XXI века благодаря полувековым усилиям научного сообщества. Искусственая экспрессия ранее неизвестных генов предоставила биохимикам новый материал для исследования часто недоступный традиционными методами....
81450. Эндэргонические и экзэргонические реакции в живой клетке. Макроэргические соединения 126.67 KB
  Многие из этих реакций происходят при участии аденозинтрифосфата АТФ играющего роль сопрягающего фактора. При сопряжении процессов 1 и 2 в реакции катализируемой гексокиназой фосфорилирование глюкозы легко протекает в физиологических условиях; равновесие реакции сильно сдвинуто вправо и она практически необратима...