75487

Индексация данных. Индексы в базах данных. Нормализация БД

Доклад

Информатика, кибернетика и программирование

Первичный ключ атрибут или совокупность атрибутов которые уникальным образом однозначно идентифицируют экземпляр объекта запись таблицы. если у таблицы задан первичный ключ то любые записи данной таблицы должны отличаться значениями первичных ключей. Вторичный ключ атрибут или совокупность атрибутов предназначенных для упорядочения таблицы. Нормализация – это разбиение таблицы на две или более обладающих лучшими свойствами при включении изменении и удалении данных.

Русский

2015-01-15

59.5 KB

0 чел.


Индексация данных. Индексы в базах данных. Нормализация БД.

Для упорядочения представлений инф-ий и ускорения поиска требуемой инф- ции применяются ключи (индексы).

Ключи бывают первичными и вторичными.

Первичный ключ- атрибут или совокупность атрибутов, которые уникальным образом однозначно идентифицируют экземпляр объекта (запись таблицы).

Т.е. если у таблицы задан первичный ключ, то любые записи данной таблицы должны отличаться значениями первичных ключей.

Вторичный ключ- атрибут или совокупность атрибутов, предназначенных для упорядочения таблицы. Значения вторичных ключей могут повторяться для различных записей.

И первичный и вторичный ключи состоящие из нескольких атрибутов упорядочиваются сначала по первому атрибуту, при их равенстве –по второму, при их равенству -по третьему и т.д.

В вырожденном случае в первичный ключ выходят все атрибуты отношения. В этом случае первичный ключ может не объявляться, а идентификация записей идет по всем полям.

Нормализация – это разбиение таблицы на две или более, обладающих лучшими свойствами при включении, изменении и удалении данных. Окончательная цель нормализации сводится к получению такого проекта базы данных, в котором каждый факт появляется лишь в одном месте, т.е. исключена избыточность информации. Это делается не столько с целью экономии памяти, сколько для исключения возможной противоречивости хранимых данных.

Как указывалось в п. 3.1, каждая таблица в реляционной БД удовлетворяет условию, в соответствии с которым в позиции на пересечении каждой строки и столбца таблицы всегда находится единственное атомарное значение, и никогда не может быть множества таких значений. Любая таблица, удовлетворяющая этому условию, называется нормализованной (см. таблицы рис. 4.24.4). Фактически, ненормализованные таблицы, т.е. таблицы, содержащие повторяющиеся группы (см. рис. 4.1), даже не допускаются в реляционной БД.

Всякая нормализованная таблица автоматически считается таблицей в первой нормальной форме, сокращенно 1НФ. Таким образом, строго говоря, "нормализованная" и "находящаяся в 1НФ" означают одно и то же. Однако на практике термин "нормализованная" часто используется в более узком смысле – "полностью нормализованная", который означает, что в проекте не нарушаются никакие принципы нормализации.

Теперь в дополнение к 1НФ можно определить дальнейшие уровни нормализации – вторую нормальную форму (2НФ), третью нормальную форму (3НФ) и т.д. По существу, таблица находится в 2НФ, если она находится в 1НФ и удовлетворяет, кроме того, некоторому дополнительному условию, суть которого будет рассмотрена ниже. Таблица находится в 3НФ, если она находится в 2НФ и, помимо этого, удовлетворяет еще другому дополнительному условию и т.д.

Таким образом, каждая нормальная форма является в некотором смысле более ограниченной, но и более желательной, чем предшествующая. Это связано с тем, что "(N+1)-я нормальная форма" не обладает некоторыми непривлекательными особенностями, свойственным "N-й нормальной форме". Общий смысл дополнительного условия, налагаемого на (N+1)-ю нормальную форму по отношению к N-й нормальной форме, состоит в исключении этих непривлекательных особенностей. В п. 4.3 мы выявляли непривлекательные особенности таблицы рис. 4.2 и для их исключения выполняли "интуитивную нормализацию".

Теория нормализации основывается на наличии той или иной зависимости между полями таблицы. Определены два вида таких зависимостей: функциональные и многозначные.

Функциональная зависимость. Поле В таблицы функционально зависит от поля А той же таблицы в том и только в том случае, когда в любой заданный момент времени для каждого из различных значений поля А обязательно существует только одно из различных значений поля В. Отметим, что здесь допускается, что поля А и В могут быть составными.

Например, в таблице Блюда (рис. 4.4) поля Блюдо и Вид функционально зависят от ключа БЛ, а в таблице Поставщики рис. 4.3 поле Страна функционально зависит от составного ключа (Поставщик, Город). Однако последняя зависимость не является функционально полной, так как Страна функционально зависит и от части ключа – поля Город.

Полная функциональная зависимость. Поле В находится в полной функциональной зависимости от составного поля А, если оно функционально зависит от А и не зависит функционально от любого подмножества поля А.

Многозначная зависимость. Поле А многозначно определяет поле В той же таблицы, если для каждого значения поля А существует хорошо определенное множество соответствующих значений В.

Обучение

Дисциплина

Преподаватель

Учебник

Информатика

Шипилов П.А.

Форсайт Р. Паскаль для всех

Информатика

Шипилов П.А.

Уэйт М. и др. Язык Си

Информатика

Голованевский Г.Л.

Форсайт Р. Паскаль для всех

Информатика

Голованевский Г.Л.

Уэйт М. и др. Язык Си

...

...

...

Рис. 4.5. К иллюстрации многозначных зависимостей

Для примера рассмотрим таблицу "Обучение" (рис. 4.5). В ней есть многозначная зависимость "Дисциплина-Преподаватель": дисциплина (в примере Информатика) может может читаться несколькими преподавателями (в примере Шипиловым и Голованевским). Есть и другая многозначная зависимость "Дисциплина-Учебник": при изучении Информатики используются учебники "Паскаль для всех" и "Язык Си". При этом Преподаватель и Учебник не связныфункциональной зависимостью, что приводит к появлению избыточности (для добавление еще одного учебника придется ввести в таблицу две новых строки). Дело улучшается при замене этой таблицы на две: (Дисциплина-Преподаватель и Дисциплина-Учебник).


 

А также другие работы, которые могут Вас заинтересовать

24245. Особенности работы PR-структур в условиях кризиса 30 KB
  Для этого в компании должен быть заранее подготовленный список возможных проблем и план действий в случае кризиса. Кризисный PR план должен быть составной частью кризисной программы организации и может включать следующие элементы: возможные сценарии развития ситуации ответственные лица с четким распределением ролей и место сбора кризисной рабочей группы список контактов вне компании которые могут пригодиться в кризисной ситуации заранее заготовленные заявления и шаблоны прессрелизов Сама проблема – не кризис СМИ катализатор который...
24247. Разработка и реализация PR-акций 24.5 KB
  Разработка и реализация PRакций Главное отличие PRакции от PRкампании в том что PRакция НЕ носит комплексного характера. Тем не менее разработка PRакций большинства компаний состоит в следующем: 1. Постановка общей цели: опираясь на результаты анализа можно сформулировать общую цель проведения PRакций. Это один из ключевых компонентов в разработке PRакций.
24249. Разработка и реализация PR-акций 26 KB
  Тем не менее разработка PRакций большинства компаний состоит в следующем: 1. Постановка общей цели: опираясь на результаты анализа можно сформулировать общую цель проведения PRакций. Это один из ключевых компонентов в разработке PRакций.
24250. Как поддержать развитие способностей одарённого ребенка в школьных условиях 50.96 KB
  Ребёнок рождается одаренным от природы разными талантами. Уже в детском саду проявляются его пристрастия. Он(а) может часами кружиться в танце, напевая себе под нос только ей(ему) слышимую незамысловатую мелодию. Или сосредоточенно лепить из пластилина замок, или рисовать (например, цветы, полянку и озеро).
24251. Художественная литература 16.43 KB
  Художественная литература - могучее действенное средство умственного нравственного и эстетического воспитания детей. Произведения литературы дают образцы русской литературной речи.
24252. ИСПОЛЬЗОВАНИЕ ЗДОРОВЬЕСБЕРЕГАЮЩИХ МЕТОДИК ПО РАЗВИТИЮ ОБЩЕЙ И МЕЛКОЙ МОТОРИКИ В РАБОТЕ УЧИТЕЛЯ-ЛОГОПЕДА 61 KB
  В настоящее время увеличилось количество детей имеющие различные нарушения речи от НПОЗ (нарушения произношения отдельных звуков) до тяжелых нарушений речи – ОНР осложненной дизартрией. Эти данные подтвеждаются после проведения ежегодного мониторинга развития речи у детей дошкольного возраста - воспитанников детского сада.
24253. ПРАВОВОЕ РЕГУЛИРОВАНИЕ ДЕЯТЕЛЬНОСТИ В СФЕРЕ ПР 75.5 KB
  ПРАВОВОЕ РЕГУЛИРОВАНИЕ ДЕЯТЕЛЬНОСТИ В СФЕРЕ ПР. не совсем то но похожее Право как регулятор СОдеятельности. Специалистам в области ПР приходиться действовать во все более сложном правовом климате. Эта озабоченность вызвала появление новых законов и правовых норм.