11413

Нормализация баз данных

Лабораторная работа

Информатика, кибернетика и программирование

Лабораторная работа № 1. Нормализация баз данных. Задание: 1. Спроектировать реляционную базу данных состоящую из четырех связанных отношений. 2. Произвести нормализацию БД до третьей нормальной формы. Нормализация данных Один и тот же набор данных в реляцио...

Русский

2013-04-07

36 KB

65 чел.

Лабораторная работа № 1. Нормализация баз данных.

Задание:

1. Спроектировать реляционную базу данных, состоящую из четырех связанных отношений.

2. Произвести нормализацию БД до третьей нормальной формы.

Нормализация данных

Один и тот же набор данных в реляционной модели можно представить различными способами. Процесс нормализации данных позволяет решить вопрос о наиболее эффективной их структуре, обладающей минимальной избыточностью. Это позволяет решить следующие задачи:

а) исключить ненужное повторение данных;

б) обеспечить быстрый доступ к данным;

в) обеспечить целостность данных.

Каждой нормальной форме соответствует некоторый определенный набор ограничений, и отношение находится в некоторой нормальной форме, если удовлетворяет свойственному ей набору ограничений.

В теории реляционных баз данных обычно выделяется следующая последовательность нормальных форм:

  •  первая нормальная форма (1NF);
  •  вторая нормальная форма (2NF);
  •  третья нормальная форма (3NF);
  •  нормальная форма Бойса-Кодда (BCNF);
  •  четвертая нормальная форма (4NF);
  •  пятая нормальная форма, или нормальная форма проекции-соединения (5NF или PJ/NF).

Основные свойства нормальных форм:

  •  каждая следующая нормальная форма в некотором смысле лучше предыдущей;
  •  при переходе к следующей нормальной форме свойства предыдущих нормальных форм сохраняются.

(Бритва Оккама – не плоди сущностей сверх необходимого, а тут плодить нужно)

В основе процесса проектирования лежит метод нормализации, декомпозиция отношения, находящегося в предыдущей нормальной форме, в два или более отношения, удовлетворяющих требованиям следующей нормальной формы.

Примером набора ограничений является ограничение первой нормальной формы: значения всех атрибутов отношения атомарны (просты или скалярны) и отсутствуют повторяющиеся кортежи. Например, атрибут «Адрес» должен быть разбит на три «Страна», «Город» и «Адрес». Второе свойство легко удовлетворяется введением ключевого поля. Наличие повторяющейся информации ведет к возможной потери согласованности данных, т.е. возникновению аномалий обновления и неоправданному увеличению размера БД. Аномалии обновления можно условно разбить на три вида:

а) аномалии добавления. Возникают в случаях, когда информацию в таблицу нельзя поместить до тех пор, пока она не полная. Например, мы хотим добавить информацию о пришедшем на склад новом товаре, у которого еще нет покупателей. Нам придется оставить незаполненными все поля, касающиеся клиентов и оформления заказа. Но если некоторые поля были объявлены обязательными, то либо в них придется ввести что-нибудь, либо вообще отказаться от записи. Кроме того, после первой же покупки - этого товара необходимость в такой записи вообще отпадет;

б) аномалии удаления. Состоят в том, что при удалении некоторой информации может пропасть и другая информация, не связанная напрямую с удаляемой. Например, при удалении последней записи о продаже некоторого товара сведения о нем будут утеряны, хотя это никак не будет означать, что данного товара больше нет на складе;

в) аномалии модификации. Проявляются в том, что изменение значений некоторого поля в одной записи может привести к просмотру всей таблицы и соответствующему изменению других ее записей. Например, такая аномалия возникнет при обновлении не всех записей о покупках какого-либо клиента при смене его адреса. Причем простая автозамена здесь поможет не во всех случаях, так как адрес может быть записан разными способами.

Требование первой нормальной формы является базовым требованием классической реляционной модели данных, мы будем считать, что исходный набор отношений уже соответствует этому требованию.

Отношение находится во второй нормальной форме (2NF) в том и только в том случае, когда находится в 1NF, и каждый неключевой атрибут полностью зависит от первичного ключа (либо каждого ключевого атрибута).

Третья нормальная форма. (Снова определение дается в предположении существования единственного ключа.) 

Отношение находится в третьей нормальной форме (3NF) в том и только в том случае, если находится в 2NF и каждый неключевой атрибут нетранзитивно зависит от первичного ключа.

Третья форма также постулирует отсутствие полей, которые могут быть вычислены на основе других.

Форма Бойса-Кодда.

Таблица находится в форме Бойса-Кодда, если:

1) удовлетворяет требованиям третьей нормальной формы;

2) в ней отсутствуют зависимости атрибутов составного ключа от неключевых атрибутов.

Четвертая нормальная форма устраняет нетривиальные многозначные зависимости. Если таблица содержит два и более никак не связанных между собой многозначных атрибута, то по требованиям первой нормальной формы нам потребуется сделать отдельную запись для каждого значения каждого многозначного атрибута. Общее число записей будет равно числу сочетаний значений, принимаемых многозначными атрибутами, и может быть очень большим. Легко увидеть, что часть информации повторяется. Следовательно, для уменьшения избыточности информации и устранения возможности появления несогласованного состояния данных необходимо прибегнуть к дальнейшей декомпозиции отношения.

Пятая нормальная форма основывается на концепции устранения зависимостей объединения. Может случиться ситуация, когда нельзя разбить таблицу на две таким образом, чтобы получить после объединения исходный результат (некоторые записи могут быть потеряны или, наоборот, могут появиться подложные записи). Однако при этом существует ситуация, что при выполнении всех правил нормализации такую таблицу можно разбить на три и более таблиц. На практике этот вид зависимости очень трудно обнаружить и, следовательно, устранить.

Сформулируем несколько правил, которых следует придерживаться при нормализации таблиц.

1. Разрабатывайте схему данных таким образом, чтобы можно было легко объяснить ее, т. е. не комбинируйте атрибуты независимых объектов и не создавайте сложные связи.

2. Разрабатывайте схему данных таким образом, чтобы исключить возможность появления аномалий обновления,

3. Разрабатывайте схему данных таким образом, чтобы в связях участвовали только первичные (можно допустить потенциальные) и внешние ключи, Это позволит избежать появления подложных записей.


 

А также другие работы, которые могут Вас заинтересовать

12243. Финансово-хозяйственные операции по отражению объекта учета 99.48 KB
  Я ставлю перед собой цель рассказать, как видеться учет доходов на предприятии. Предприятия отличаются отрасли, производством, численностью, правовой формой и так далее, но я рассмотрю общую систему учета доходов предприятия...
12244. Дизъюнктивные нарушения 659.91 KB
  Вернемся к основной теме. Как уже было сказано дизъюнктивные нарушения — это разрыв пластов, горных пород которые образуются, при воздействии двух разнонаправленных сил на слой горных пород, слой сначала изгибается, а затем – разрывается.
12245. Діагностика міжособистісних стосунків у підлітковому віці 346 KB
  Важливим аспектом життєдіяльності колективу, знання якого має важливе практичне значення для кожного, хто працює з людьми, є міжособистісні стосунки у групі. Ці стосунки неминуче виникають між членами колективу на ґрунті їхнього спілкування та взаємодії у процесі реалізації завдань, на виконання яких спрямовуються їхні зусилля.
12246. МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО ВЫПОЛНЕНИЮ ЛАБОРАТОРНЫХ РАБОТ ПО ДИСЦИПЛИНЕ «ЭЛЕКТРОТЕХНИЧЕСКИЕ МАТЕРИАЛЫ» 629 KB
  методические указания по выполнению лабораторных работ по дисциплине Электротехнические материалы ЛАБОРАТОРНАЯ РАБОТА №1 ЭЛЕКТРОТЕХНИЧЕСКИЕ МАТЕРИАЛЫ Цель работы: ознакомиться с электроизоляционными проводниковыми и магнитными материалами методами их
12247. ЛАБОРАТОРНАЯ РАБОТА №1 ЭЛЕКТРОТЕХНИЧЕСКИЕ МАТЕРИАЛЫ 168 KB
  ЛАБОРАТОРНАЯ РАБОТА №1 ЭЛЕКТРОТЕХНИЧЕСКИЕ МАТЕРИАЛЫ Цель работы: ознакомиться с электроизоляционными проводниковыми и магнитными материалами методами их получения основными характеристиками свойствами областями применения. ПРОГРАММА РАБОТЫ 1. Ознако
12248. Прямые методы минимизации функции одной переменной 1 MB
  Лабораторная работа 1. Прямые методы минимизации функции одной переменной. В данной работе рассматриваются методы решения поставленной задачи не использующие вычисления производных прямые методы минимизации. Постановка задачи: Требуется найти безусловный ми...
12249. Методы минимизации функции одной переменной, использующие информацию о производных целевой функции 781.11 KB
  Лабораторная работа 2. Методы минимизации функции одной переменной использующие информацию о производных целевой функции. Постановка задачи: Требуется найти безусловный минимум функции одной переменной fx т.е. такую точку что . Значение точки минимума вычисл
12250. Методы минимизации функции многих переменной 255.93 KB
  Лабораторная работа 3. Методы минимизации функции многих переменной. Постановка задачи: Требуется найти безусловный минимум функции от n переменных fx1 x2 xn т.е. такую точку что . Значение точки минимума вычислить приближенно с заданной точностью ε. Метод пр
12251. Измерение характеристик случайных процессов 124.5 KB
  ЛАБОРАТОРНАЯ РАБОТА № 3 Измерение характеристик случайных процессов I. Цели работы 1. Закрепить и расширить знания о стационарных и нестационарных широкополосных и узкополосных случайных процессах. 2. Ознакомиться с методами экспериментальных исследований случ