27101

Нормализация данных в базе данных. Виды аномалий

Доклад

Информатика, кибернетика и программирование

Виды аномалий Нормализация таблиц базы данных это процесс организации данных в базе данных включающий создание таблиц и установление отношений между ними в соответствии с правилами которые обеспечивают защиту данных и делают базу данных более гибкой устраняя избыточность и несогласованные зависимости. Главная цель нормализации базы данных устранение избыточности и дублирования информации. В идеале при нормализации надо добиться чтобы любое значение хранилось в базе в одном экземпляре причем значение это не должно быть получено...

Русский

2013-08-19

40 KB

60 чел.

3) Нормализация данных в базе данных. Виды аномалий

Нормализация таблиц базы данных - это процесс организации данных в базе данных, включающий создание таблиц и установление отношений между ними в соответствии с правилами, которые обеспечивают защиту данных и делают базу данных более гибкой, устраняя избыточность и несогласованные зависимости.

Главная цель нормализации базы данных - устранение избыточности и дублирования информации. В идеале при нормализации надо добиться, чтобы любое значение хранилось в базе в одном экземпляре, причем значение это не должно быть получено расчетным путем из других данных, хранящихся в базе.

Первая нормальная форма:

  •  запрещает повторяющиеся столбцы (содержащие одинаковую по смыслу информацию)
  •  запрещает множественные столбцы (содержащие значения типа списка и т.п.)
  •  требует определить первичный ключ для таблицы, то есть тот столбец или комбинацию столбцов, которые однозначно определяют каждую строку

Вторая нормальная форма требует, чтобы неключевые столбцы таблиц зависили от первичного ключа в целом, но не от его части. Маленькая ремарочка: если таблица находится в первой нормальной форме и первичный ключ у нее состоит из одного столбца, то она автоматически находится и во второй нормальной форме.

Чтобы таблица находилась в третьей нормальной форме, необходимо, чтобы неключевые столбцы в ней не зависели от других неключевых столбцов, а зависели только от первичного ключа. Самая распространенная ситуация в данном контексте - это расчетные столбцы, значения которых можно получить путем каких-либо манипуляций с другими столбцами таблицы. Для приведения таблицы в третью нормальную форму такие столбцы из таблиц надо удалить.

Нормальная форма Бойса-Кодда требует, чтобы в таблице был только один потенциальный первичный ключ. Чаще всего у таблиц, находящихся в третьей нормальной форме, так и бывает, но не всегда. Если обнаружился второй столбец (комбинация столбцов), позволяющий однозначно идентифицировать строку, то для приведения к нормальной форме Бойса-Кодда такие данные надо вынести в отдельную таблицу.

Для приведения таблицы, находящейся в нормальной форме Бойса-Кодда, к четвертой нормальной форме необходимо устранить имеющиеся в ней многозначные зависимости. То есть обеспечить, чтобы вставка / удаление любой строки таблицы не требовала бы вставки / удаления / модификации других строк этой же таблицы.

Таблицу, находящуюся в четвертой нормальной форме и, казалось бы, уже нормализованную до предела, в некоторых случаях еще можно бывает разбить на три или более (но не на две!) таблиц, соединив которые, мы получим исходную таблицу. Получившиеся в результате такой, как правило, весьма искусственной, декомпозиции таблицы и называют находящимися в пятой нормальная форме. Формальное определение пятой нормальной формы таково: это форма, в которой устранены зависимости соединения. В большинстве случаев практической пользы от нормализации таблиц до пятой нормальной формы не наблюдается.

Разработаны специальные формальные математические методы нормализации таблиц реляционных баз данных.

Главное, чего мы добьемся, проведя нормализацию базы данных - это устранение (или, по крайней мере, серьезное сокращение) избыточности, дублирования данных. Как следствие, значительно сокращается вероятность появления противоречивых данных, облегчается администрирование базы и обновление информации в ней, сокращается объем дискового пространства.

Виды аномалий:

Аномалии – это проблемы, возникающие в данных из-за дефектов проектирования БД. Существуют три вида аномалий: вставки, удаления и модификации.

Аномалии вставки проявляются при вводе данных в дефектную таблицу. Добавляя информацию о новом сотруднике, мы должны добавить номер и название отдела. Если ввести данные, не соответствующие имеющимся в таблице (например, 42, отдел проектирования), будет не ясно, какая из строк БД содержит правильную информацию.

Аномалии удаления возникают при удалении данных из дефектной схемы. Предположим, что все сотрудники отдела 128 уволились в один и тот же день. После удаления записей этих сотрудников в БД больше не будет ни одной записи, содержащей информацию об отделе 128.

Аномалии модификации возникают при изменении данных дефектной схемы. Предположим, что отдел 128 решили переименовать в отдел передовых технологий. Необходимо изменить соответствующие данные о каждом сотруднике отдела. Если мы пропустим хотя бы одну запись, возникнет аномалия модификации.


 

А также другие работы, которые могут Вас заинтересовать

70579. Виды деятельности, не относящиеся к предпринимательской 63 KB
  К предпринимательской деятельности не относятся: ремесленная деятельность; организация агроэкотуризма; ведение личного подсобного хозяйства. Деятельность по оказанию услуг в сфере агроэкотуризма осуществляется физическими лицами без государственной регистрации в качестве...
70580. Методологические основы государственного регулирования экономики 53.5 KB
  Государственное регулирование экономики в условиях рыночного хозяйства представляет собой систему государственных мер законодательного исполнительного и контролирующего характера осуществляемых правомочными государственными учреждениями и общественными организациями в целях...
70581. Формы и методы государственного регулирования экономики 63.5 KB
  Директивное планирование (ДП) - форма ГРЭ, длительное время существовавшая в СССР и других социалистических странах. При ДП план экономического развития имеет силу закона и является обязательным для исполнения воли звеньями экономической системы: регионами, отдельными предприятиями.
70582. Теоретические основы формирования и реализации макроэкономической политики государства (МПГ) 50 KB
  МПГ в системе государственного регулирования экономики Экономика любого государства не может развиваться без определения цели ее развития. Под экономической целью понимается основное направление развития экономики которое раскрывается с помощью поставленных задач.
70583. Воспитание и образования эпохи Средневековья 67.47 KB
  Объектом её изучение стал человек в его обычной жизни. Античность присутствовала в культуре на протяжении всего Средневековья: Средневековое богословие развивалось авторами имевшими высокий уровень античной образованности на них большое влияние оказали идеи Платона Аристотеля стоиков...
70584. УПРАВЛЕНИЕ ДАННЫМИ 1009 KB
  Основное назначение данного курса систематическое введение в идеи и методы используемые в современных реляционных системах управления базами данных. Как показывает опыт без знания основ баз данных трудно на серьезном уровне работать с конкретными системами как бы хорошо они не были документированы.
70585. ОГРАНИЧЕНИЯ И ПРЕКРАЩЕНИЕ ПРАВ НА ЗЕМЕЛЬНЫЕ УЧАСТКИ. ИЗЪЯТИЕ ЗЕМЕЛЬНЫХ УЧАСТКОВ. ПОРЯДОК ИЗЪЯТИЯ И ПРЕДОСТАВЛЕНИЯ ЗЕМЕЛЬНЫХ УЧАСТКОВ ДЛЯ ГОСУДАРСТВЕННЫХ И МУНИЦИПАЛЬНЫХ НУЖД. ВОЗМЕЩЕНИЕ УБЫТКОВ 85 KB
  Государственный кадастровый учет осуществляется по следующим основаниям: постановка на учет объекта недвижимости в связи с образованием или созданием объекта недвижимости; изменение уникальных характеристик объекта недвижимости: вида объекта недвижимости его кадастрового номера...