6179

Модели данных: нормализация отношений

Реферат

Информатика, кибернетика и программирование

Модели данных: нормализация отношений. 1НФ. Нормализация отношений Центральная задача проектирования базы данных ЭИС - определение количества отношений и их атрибутного состава. Задача группировки атрибутов в отношения допускает множеств...

Русский

2012-12-30

80.5 KB

14 чел.

Модели данных: нормализация отношений. 1НФ.

  1.   Нормализация отношений

Центральная задача проектирования базы данных ЭИС - определение количества отношений и их атрибутного состава.

Задача группировки атрибутов в отношения допускает множество различных вариантов решений. Рациональные варианты группировки должны учитывать следующие требования:

•  множество отношений должно обеспечивать минимальную избыточность представления информации,

• корректировка отношений не должна приводить к двусмысленности или потере информации,

•  перестройка набора отношений при добавлении в базу данных новых атрибутов должна быть минимальной.

Нормализация представляет собой один из способов преобразования отношений, позволяющих улучшить характеристики БД по перечисленным критериям.

Ограничения на значения, хранимые в реляционной базе данных, достаточно многочисленны. Соблюдение этих ограничений связано с наличием нормальных форм. Процесс преобразования отношений базы данных к той или иной нормальной форме называется нормализацией отношений. Нормальные формы нумеруются последовательно от 1 по возрастанию, и чем больше номер нормальной формы, тем больше ограничений на хранимые значения должно соблюдаться в соответствующем отношении.

Ограничения, типичные для реляционной модели данных - это функциональные и многозначные зависимости, а также их обобщения (обеспечивается сокращение избыточной информации в реляционной БД). Множество дополнительных ограничений может расти и, соответственно, будет увеличиваться число нормальных форм.

Отношение в первой нормальной форме (сокращенно 1НФ) - это обычное отношение с двухуровневой структурой. Недопустимость в структуре отношения третьего и последующих уровней является ограничением, определяющим 1НФ - отношения.

Преобразование ненормализованного отношения в представление, соответствующее 1НФ - это операция нормализации.  Реляционная база данных в целом характеризуется 1НФ, если все ее отношения соответствуют 1НФ.

Следующие нормальные формы (вторая и третья) используют ограничения, связанные с понятием функциональной зависимости.

2.   Функциональные   зависимости  и   ключи

Функциональные зависимости определяются для атрибутов, находящихся в одном и том же отношении, удовлетворяющем 1НФ. Простейший случай функциональной зависимости охватывает 2 атрибута. В отношении R(A,B,...) атрибут А функционально определяет атрибут В, если в любой момент времени каждому значению А соответствует единственное значение В (обозначается А В).

Иначе говорят, что В функционально зависит от А (обозначается В = f(A)). Отсутствие функциональной зависимости обозначается А—/  В.

 

Пример 1.

I1

ФИО

ГР

Иванов

Зуев

Смирнов

Яшина

 I960

1963

1960

1961

Предположим, что в столбце ФИО представлены сведения о разных людях и значения не повторяются. Тогда можно утверждать: ФИО ГР, поскольку у каждого человека единственный год рождения. Наличие в столбце ГР повторяющихся годов (I960) означает ГР —/ ФИО.

Практически каждое ограничение для проверки функциональной зависимости можно преобразовать в утверждение о свойствах объектов предметной области.

Одновременное соблюдение двух зависимостей вида А В и В А называется взаимно-однозначным соответствием и обозначается А В.

Пример 2.

I2

Магазин

Расч

ММЗ

Динамо АТЭ

704098 122096 440162

Можно допустить, что у каждого магазина единственный номер расчетного счета и утверждать, что каждый расчетный счет принадлежит единственному магазину. Это доказывает справедливость функциональных зависимостей Магазин Расч и Расч Магазин, т.е. Магазин Расч.

Примера 3.  

I3

ФИО

Дисциплина

Петров Федин Алешин Петров

Физика Химия Физика Химия

Отношение I3 описывает экзамены, сдаваемые студентами:  ФИО —/ Дисциплина и Дисциплина —/ ФИО, т.к.  каждый студент сдает экзамены по нескольким дисциплинам, и по каждой дисциплине экзамен сдается многими студентами. Т.е. отсутствуют функциональные зависимости.

Таким образом, для атрибутов А и В некоторого отношения возможны следующие ситуации:

• отсутствие функциональной зависимости,

• наличие А В (или В А), но не обе зависимости вместе,

• наличие взаимно-однозначного соответствия А В.

Понятие функциональной зависимости распространяется на ситуацию с тремя и более атрибутами в следующей форме. Группа атрибутов (для определенности А,В,С) функционально определяет атрибут D в отношении T(A,B,C,D,....), если каждому сочетанию значений <а,b,с> соответствует единственное значение d (а - значение A, b - значение В, с - значение С, d - значение D). Наличие такой функциональной зависимости будем обозначать А,В,С D.  

Существование функциональных зависимостей связано с применяемыми способами кодирования атрибутов. Так, для множества учреждений можно утверждать, что каждый отдел (как объект предметной области) относится к единственному учреждению. Однако этого недостаточно для доказательства функциональной зависимости Отдел Учреждение. Если в каждом учреждении отделы нумеруются последовательно, начиная с 1, то функциональная зависимость неверна. Если же код отдела, кроме номера, содержит и код учреждения (или уникальность кодов обеспечивается каким-то другим способом), то функциональная зависимость Отдел Учреждение справедлива.

Зависимость ФИОГР в I1 соблюдается, если ФИО является атрибутом- идентификатором для каждого человека, что может быть справедливо только для небольших множеств людей.  

Для показателя со множеством атрибутов-признаков Р = {Р1, Р2, ... ,Рn} и атрибутом-основанием Q справедлива функциональная зависимость Р Q, но нельзя утверждать, что это единственная зависимость на указанных атрибутах.

С помощью функциональных зависимостей определяется понятие ключа отношения  - вероятный, первичный и вторичный.

Вероятным ключом отношения называется такое множество атрибутов, что каждое сочетание их значений встречается только в одной строке отношения, и никакое подмножество атрибутов этим свойством не обладает. Вероятных ключей в отношении может быть несколько.

Примера 4.  

I4

ZEN

RAM

AST

SPIM

BIG

1А

31

dwa

wii

73

ЗВ

21

bun

CUD

—*K

40

3D

30

mun

lam

58

40

31

sab

wii

40

Вероятным ключом отношения I4 является атрибут ZEN и пара атрибутов RAM, AST.

Выборка по известному значению вероятного ключа дает в результате одну строку отношения либо ни одной.

Когда в отношении присутствует несколько вероятных ключей, целесообразно выбрать один из них в качестве основного (первичного).

Первичным ключом отношения называется такой вероятный ключ, по значениям которого производится контроль достоверности информации в отношении (интересующий в данный момент аспект).

Применительно к экономической информации часто отношения содержат единственный вероятный ключ, который и является первичным ключом. Наличие двух и более вероятных ключей в отношениях можно объяснить наличием нескольких возможных способов интерпретации одних и тех же данных. Первичный ключ часто называется просто ключ.

В отношениях с большим числом строк нахождение первичного ключа путем непосредственного применения определения достаточно затруднено. Кроме того, на стадии проектирования ЭИС значения многих отношений просто неизвестны. Поэтому практически первичный ключ отношения определяется по известным функциональным зависимостям.

Каждое значение первичного ключа встречается только в одной строке отношения. Значение любого атрибута в этой строке также единственное. Если через К обозначить атрибуты первичного ключа в отношении R(A,B,C,... J), то справедливы следующие функциональные зависимости К А, К В, К С,..., К  J.

Набор атрибутов первичного ключа функционально определяет любой атрибут отношения. 

Обратно: если найдена группа атрибутов, которая функционально определяет все атрибуты отношения по отдельности, и эту группу нельзя сократить, то найден первичный ключ отношения.

Пример 5.

I5

ФИО

Дисциплина

Дата

Преподаватель

Оценка

Петров Федин Алешин Петров

Физика Химия Физика Химия

10.02.11

10.02.11

14.02.11

14.02.11

Иванов

Смирнов

Иванов

Смирнов

4

5

5

5

Ограничение, состоящее в том, что студент не может в один день сдать два и более экзаменов означает справедливость ряда  функциональных зависимостей:

ФИО, Дата Дисциплина,

ФИО, Дата Преподаватель,

ФИО, Дата Оценка.

Ясно, что

ФИО, Дата ФИО,

ФИО, Дата Дата

Следовательно, первичный ключ в отношении I5 составляют атрибуты ФИО, Дата и при поиске ключа не потребовались конкретные значения I5.

Для множества функциональных зависимостей одного отношения существует ряд закономерностей, которые выражаются теоремами. Знание теорем позволяет из исходного множества функциональных зависимостей получать производные зависимости.  

Теорема1

А, В А и А, В В.

Доказательство основано на том, что в строке <а,b> для атрибутов А и В значение а (как и значение b) присутствует один раз.

Теорема 2

А В и А С тогда и только тогда, когда А ВС.

Рассмотрим произвольное значение а атрибута А. Если АВ и АС, то imВ(а) и imC(a) содержат по одному элементу. Предположим, что зависимость А ВС неверна и im ВС(а) состоит из 2 или более элементов. Тогда либо im В(а), либо im С(а) должны содержать более одного элемента. Полученное противоречие доказывает зависимость А ВС.

Обратно, если А ВС, то  imВС(а)  содержит один элемент  вида <b,с> для любого а. Зафиксируем некоторое значение al. Значение b (как и значение с) встречается в сочетании с al только один раз, следовательно, справедливо А В и А С.

Теорема 3

Если АВ и ВС, то А С.

Предположим, что зависимость А С неверна и множество  imС(а)  содержит более одного элемента. Каждому значению а соответствует единственное значение b (в силу А В), поэтому  imC(b)  содержит более одного элемента. Получилось противоречие с условием В С, что и доказывает теорему.

Доказательства остальных теорем опираются на первые 3 теоремы.

Теорема 4

Если А  В, то АС В (С произвольно).

Доказательство :   АС А (теорема 1), А В (условие), следовательно, АС В по теореме 3.

Теорема 5

Если А В, то АС ВС ( С произвольно).

Доказательство:   АС В (теорема 4), АС С (теорема 1), следовательно, АС ВС по теореме 2.

Теорема 6 

Если А В и ВС  D, то AC  D.

Доказательство Из А В следует АС ВС (теорема 5).  ВС D (условие), поэтому АС D по теореме 3.

Количество теорем, которые можно доказать в таком стиле, можно расширить.

Для некоторого множества функциональных зависимостей F введем множество F~, называемое покрытием. Покрытие F~ содержит все функциональные зависимости, которые можно получить из множества F в результате применения теорем 1-6 (включая и содержимое F). Одно и то же покрытие F~ может быть получено из различных множеств функциональных зависимостей. Среди таких множеств выделим множество с минимальным числом зависимостей и назовем его минимальным покрытием (базисом) множества зависимостей F.

Иначе: минимальным покрытием называется множество функциональных зависимостей, из которого удалены все зависимости, являющиеся следствиями оставшихся зависимостей и теорем 1-6.

Т.о. зависимости, указанные в условии той или иной теоремы, остаются в списке функциональных зависимостей, а зависимости, указанные в заключении теоремы, удаляются.

Если известно, что вероятный ключ в отношении один, то его можно найти простым способом: это набор атрибутов, которые не встречаются в правых частях функциональных зависимостей.

Иными словами, из полного списка атрибутов отношения необходимо вычеркнуть атрибуты, встречающиеся в правых частях всех функциональных зависимостей. Оставшиеся атрибуты образуют первичный ключ.


 

А также другие работы, которые могут Вас заинтересовать

47851. Высшая математика 4.3 MB
  Султанаев Высшая математика Курс лекций для студентов всех специальностей очной и заочной форм обучения...
47852. Менеджмент. Общее управление и менеджмент 207 KB
  Общее управление это управленческая деятельность и процессы связанные с разработкой концепции и стратегии развития организации постановкой ее цели планированием организационной деятельностью координированием контролем а при необходимости и корректировкой ранее принятых решений. Необходимо обеспечить наиболее правильное соотношение между цетролизацией и декзентролизацией в зависимости от конкретных условий; вознаграждение персонала; порядок;и инициатива персонала; корпоративный дух преданность организации; единство...
47853. Лекции по правоведению. Власть, политика и право 214 KB
  Предписание права суть таковым: честно жить – другим не вредить каждому своё отдавать. Пентаграмма Схема истинного познания Вещь предмет Образ идея Идеат научный предмет Идеал осознанный предмет Дух энергия синергия познание ведение Цель польза utilit Средства instrumenti процесс Способ механизм процедура стандарт Метод техника opertio Принцип основные положения Слово термин характер характеристика Понятие свойства Категория признак Феноме явление ноомен бытие Концепт этимон Форма структура конструкция...
47854. Лекции по правоведению 609.5 KB
  Во-первых духовнонравственные подходы к праву рассуждения о нравственности права и государства не особенно приветствуется современной наукой права но вместе с тем круг людей способных судить о праве чрезвычайно широк: экономисты политики руководители различных ступеней и уровней все так или иначе сталкиваются с правом но что ещё более примечательно с правовой парадигмой мышления хотя подчас этого и не осознают.7 Конституции РФ: Человек его права и свободы являются высшей ценностью. Мы раскроем природу начал этих парадигм для...
47855. Понятие о структуре данного. Уровни представления структур данных 734.5 KB
  Вырожденные простейшие структуры данных называются также типами данных. Любая структура на абстрактном уровне может быть представлена в виде двойки DR где D – конечное множество элементов которые могут быть типами данных либо структурами данных а R – множество отношений свойства которого определяют различные типы структур данных на абстрактном уровне. СД типа массив. Массив – последовательность элементов одного типа называемого базовым.
47856. ПІДПРИЄМСТВО В СУЧАСНІЙ СИСТЕМІ ГОСПОДАРЮВАННЯ 4.18 MB
  Підприємства мають такі ознаки: виробничотехнічна єдність спільність продукції що виготовляється процесів її виробництва певний склад виробничих фондів єдина технічна політика спільність допоміжного і обслуговуючого господарств; організаційносоціальна єдність наявність єдиного трудового колективу керівника та адміністрації підприємства наділення підприємства правами і реквізитами юридичної особи; фінансовоекономічна самостійність можливість самостійно визначати напрямки економічного розвитку склад обсяги продукції що...
47857. АНЕМІЇ У ДІТЕЙ РАННЬОГО ВІКУ. ДЕФІЦИТНІ АНЕМІЇ 1.6 MB
  Дефіцит заліза у дітей: причини патогеннез клініка діагностика диференційна діагностика. У дітей вміст гемоглобіну крові в межах вікової норми на нижніх границях : 110118 г л – у дітей перших п’яти років; 120128г л – у дітей старших п’яти років. Найчастіше ЗДА зустрічаються у дітей другого і третього років життя 4075.
47858. Педагогіка і психологія в системі наук про людину 1.39 MB
  Протягом сторіч педагогіка розвивалася як практика навчання і виховання дітей. За сучасних умов педагогіку розглядають як науку і практику навчання і виховання людини на всіх вікових етапах її особистісного і професійного розвитку оскільки: сучасна система освіти і виховання стосується практично всіх людей; у багатьох країнах створена система безперервної освіти людини; вона містить у собі всі ланки – від дошкільної установи до професійної підготовки і курсів підвищення кваліфікації. Тобто процес навчання і виховання людини як особлива...
47859. Загальні принципи проектування телефонних мереж 126 KB
  Процес проектування його методи та особливості Основою створення будьякого об’єкта є процес проектування. Проектування – це комплекс робіт який складається з пошуку досліджень розрахунків та конструювання достатнього для створення нового об’єкта чи реконструкції старого що відповідає заданим вимогам. Проектування яке здійснюється людиною з застосуванням комп’ютера наз.