Каждой нормальной форме соответствует некоторый определенный набор ограничений, и отношение находится в некоторой нормальной форме, если удовлетворяет.

Презентация:



Advertisements
Похожие презентации
Проектирование БД. Нормальные формы В теории реляционных баз данных обычно выделяется следующая последовательность нормальных форм: первая нормальная.
Advertisements

Нормализация таблиц реляционной базы данных © Панова И.В
1 БАЗЫ ДАННЫХ Функциональные зависимости и их использование в базах данных ЗАНЯТИЕ 4 ПУГАЧЁВ Ю.В. Учитель информатики Харьковская общеобразовательная школа.
Нормализация данных В IDEF1X (дополнительный материал к лекции по информационному моделированию с использованием методологии IDEF1X)
Модуль 1. Математические основы баз данных и знаний 1.
Нормализация данных В IDEF1X (дополнительный материал к лекции по информационному моделированию с использованием методологии IDEF1X)
Базы данных Лекция 9 Проектирование реляционных баз данных на основе принципов нормализации: дальнейшая нормализация.
ПОСТРОЕНИЕ ДЕКОМПОЗИЦИИ, УДОВЛЕТВОРЯЮЩЕЙ ТРЕБОВАНИЯМ 3НФ Синтетический подход. Часть 1.
Нормализация реляционной модели данных По учебнику Семакин Н.Г., Хеннер Е.К. Информационные системы и модели © 2006 Медведев Л.Н.
Нормализация отношений "Сложная система, спроектированная наспех, никогда не работает, и исправить её, чтобы заставить работать, невозможно". Законы Мерфи.
Проектирование баз данных сложная задача. Теорию реляционных баз данных в 70 годах XX века разработал Е. Кодд. Сущность его теории сводится к приведению.
БАЗЫ ДАННЫХ ЛЕКЦИЯ 8. тема: ТЕОРИЯ НОРМАЛЬНЫХ ФОРМ.
Нормализация реляционной модели данных. Реляционная модель данных – это множество взаимосвязанных отношений. Простейший вариант реляционной модели – одно.
ЛЕКЦИЯ 2 ОСНОВЫ РЕЛЯЦИОННОЙ АЛГЕБРЫ Вопрос 1. Основные операции над отношениями в реляционных базах данных. Вопрос 2. Нормализация реляционных баз данных.
Функциональные зависимости Нормализация отношений.
Нормализация. Рассматриваемые вопросы: 1.Нормализация 2.Классы отношений 3.Первоя нормальная форма 4.Вторая нормальная форма 5.Третья нормальная форма.
СУБД 4. Основы проектирования баз данных. Этапы жизненного цикла базы данных 1 Этапы проектирования : 1.Системный анализ и словесное описание информационных.
Четвёртая нормальная форма (4NF). 1. Определения Четвёртая нормальная форма (4NF) одна из возможных нормальных форм отношения реляционной базы данных.
Нормальная форма Бойса - Кодда Отношение находится в нормальной форме Бойса – Кодда когда оно находится в третьей нормальной форме и в нём отсутствуют.
НОРМАЛИЗАЦИЯ ПЕРВАЯ НОРМАЛЬНАЯ ФОРМА Отношение R находится в первой нормальной форме (1НФ), если значения каждого его атрибута являются атомарными, т.е.
Транксрипт:

Каждой нормальной форме соответствует некоторый определенный набор ограничений, и отношение находится в некоторой нормальной форме, если удовлетворяет свойственному ей набору ограничений. Примером набора ограничений является ограничение первой нормальной формы - значения всех атрибутов отношения атомарны. Поскольку требование первой нормальной формы является базовым требованием классической реляционной модели данных, мы будем считать, что исходный набор отношений уже соответствует этому требованию.

Процесс проектирования производится методом последовательных приближений к удовлетворительному набору схем отношений. Исходной точкой является представление предметной области в виде одного или нескольких отношений, и на каждом шаге проектирования производится некоторый набор схем отношений, обладающих лучшими свойствами. Процесс проектирования представляет собой процесс нормализации схем отношений, причем каждая следующая нормальная форма обладает свойствами лучшими, чем предыдущая.

СТРУКТУРА НОРМАЛИЗАЦИИ : В теории реляционных баз данных обычно выделяется следующая последовательность нормальных форм: первая нормальная форма (1NF);1NF вторая нормальная форма (2NF);2NF третья нормальная форма (3NF);3NF нормальная форма Бойса-Кодда (BCNF);BCNF четвертая нормальная форма (4NF);4NF пятая нормальная форма, или нормальная форма проекции-соединения (5NF или PJ/NF).5NF Нормализация таблиц базы данных - первый шаг на пути проектирования структуры реляционной базы данных. База данных считается нормализованной, если ее таблицы представлены как минимум в третьей нормальной форме. Часто многие таблицы нормализуются до четвертой нормальной формы, иногда, наоборот, производится денормализация. Главная цель нормализации базы данных - устранение избыточности и дублирования информации. В идеале при нормализации надо добиться, чтобы любое значение хранилось в базе в одном экземпляре, причем значение это не должно быть получено расчетным путем из других данных, хранящихся в базе.

Первая нормальная форма: Дети не являются элементарными данными, следовательно, таблицу нельзя вводить таким образом, её необходимо преобразовать Таб. ФИОДолжность кабинета ТелефонДети 1ИвановДиректор32212Саша(1996) Маша(1995) 2ЗайцеваБухгалтер33213Петя(1992) Витя(1997) Лена(1999) 3ВолковМенеджер

Первая нормальная форма Теперь все ячейки таблицы являются элементарными неделимыми (атомарными) данными и таблица может быть помещена в БД Таб. PK ФИО Должность кабинета ТелефонИмя ребёнка Год рождения ребёнка PK 1ИвановДиректор32212Саша ЗайцеваБухгалтер33213Петя ВолковМенеджер ИвановДиректор32212Маша ЗайцеваБухгалтер33213Витя ЗайцеваБухгалтер33213Лена19993

Аномалия вставки: Волков не может быть внесён в базу данных, т.к. у него нет детей, а эта информация входит в состав ключа Таб. PK ФИО Должность кабинета ТелефонИмя ребёнка Год рождения ребёнка PK 1ИвановДиректор32212Саша ЗайцеваБухгалтер33213Петя ВолковМенеджер ИвановДиректор32212Маша ЗайцеваБухгалтер33213Витя ЗайцеваБухгалтер33213Лена19993

Аномалия модификации Зайцева сменила фамилию. Если не принять специальных мер, изменение базы может быть произведено не полностью, и в базе данных окажется противоречивая информация. Таб. PK ФИО Должность кабинета ТелефонИмя ребёнка Год рождения ребёнка PK 1ИвановДиректор32212Саша ПетроваБухгалтер33213Петя ИвановДиректор32212Маша ЗайцеваБухгалтер33213Витя ЗайцеваБухгалтер33213Лена19993

Аномалия удаления Дети, достигшие совершеннолетия, удаляются из БД. Однако, вместе с удалением Саши, ребенка Иванова, мы удалили и информацию о самом Иванове. Таб. PK ФИО Должность кабинета ТелефонИмя ребёнка Год рождения ребёнка PK 1ИвановДиректор32212Саша ПетроваБухгалтер33213Петя ИвановДиректор32212Маша ЗайцеваБухгалтер33213Витя ЗайцеваБухгалтер33213Лена19993

Основные определения: Наиболее важные на практике нормальные формы отношений основываются на фундаментальном в теории реляционных баз данных понятии функциональной зависимости. Для дальнейшего изложения потребуются несколько определений. Определение 1. Функциональная зависимость В отношении R атрибут Y функционально зависит от атрибута X (X и Y могут быть составными) в том и только в том случае, если каждому значению X соответствует в точности одно значение Y: R.X --> R.Y. Определение 2. Полная функциональная зависимость Функциональная зависимость R.X --> R.Y называется полной, если атрибут Y не зависит функционально от любого точного подмножества X.

Основные определения: Определение 3. Транзитивная функциональная зависимость Функциональная зависимость R.X --> R.Y называется транзитивной, если существует такой атрибут Z, что имеются функциональные зависимости R.X --> R.Z и R.Z --> R.Y и отсутствует функциональная зависимость R.Z --> R.X. (При отсутствии последнего требования мы имели бы "неинтересные" транзитивные зависимости в любом отношении, обладающем несколькими ключами.) Определение 4. Неключевой атрибут Неключевым атрибутом называется любой атрибут отношения, не входящий в состав первичного ключа. Определение 5. Взаимно независимые атрибуты Два или более атрибута взаимно независимы, если ни один из этих атрибутов не является функционально зависимым от других.

Вторая нормальная форма: Определение: Отношение R находится во второй нормальной форме (2NF) в том и только в том случае, когда оно находится в 1NF, и каждый неключевой атрибут функционально полно зависит от ключа R.

Вторая нормальная форма: Таб PK ребёнка PK Имя ребёнка Год рожде ния 11Саша Петя Маша Витя Лена1999 Таб. PK ФИОДолжность кабине та Телефон 1ИвановДиректор ЗайцевБухгалтер ВолковМенеджер КошкинаМенеджер35311

Третья нормальная форма: Предположим, что в кабинете 35 изменился телефон. Изменения требуется синхронно внести в две строки, следовательно, существует аномалия модификаций. Пусть есть кабинет, который ещё не занят, тогда невозможно (без сотрудника) внести информацию о телефоне в этом кабинете. Следовательно, существует аномалия вставки Существует аномалия удаления (если в кабинете капитальный ремонт, то необходимо убрать сотрудников, следовательно, теряются данные о телефоне). Таб. PK ФИОДолжность кабинетаТелефон 1ИвановДиректор ЗайцевБухгалтер ВолковМенеджер КошкинаМенеджер35311

Третья нормальная форма: Причина существования аномалий в том, что телефона не зависит от ключа (точнее, зависит от ключа транзитивно, через кабинета). В отношении существует зависимость между неключевыми атрибутами.

Третья нормальная форма: Определение: Отношение R находится в третьей нормальной форме (3NF) в том и только в том случае, если находится во 2NF, и каждый неключевой атрибут не является транзитивно зависимым от какого-либо ключа R. На практике третья нормальная форма схем отношений достаточна в большинстве случаев, и приведением к третьей нормальной форме процесс проектирования реляционной базы данных обычно заканчивается.

Третья нормальная форма: кабинета PK Телефон Таб. ФИОДолжность кабинета 1ИвановДиректор32 2ЗайцевБухгалтер33 3ВолковМенеджер35 4КошкинаМенеджер35

Основные свойства нормальных форм: каждая следующая нормальная форма в некотором смысле лучше предыдущей; при переходе к следующей нормальной форме свойства предыдущих нормальных свойств сохраняются.

НАЗНАЧЕНИЕ НОРМАЛИЗАЦИИ Устранить аномалии обновления отношений (При проведении нормализации базы данных происходит устранение или серьезное сокращение избыточности, дублирования данных): 1. Аномалии вставки 2. Аномалии удаления 3. Аномалия обновления Значительно сокращается вероятность появления противоречивых данных. Облегчается администрирование базы и обновление информации в ней, сокращается объем занятого базой дискового пространства.

Зачастую, чтобы извлечь информацию из нормализованной базы данных, приходится конструировать очень сложные запросы, которые к тому же, бывает, работают довольно медленно - из-за, главным образом, большого количества соединений таблиц. Поэтому, чтобы увеличить скорость выборки данных и упростить программирование запросов, нередко приходится идти на выборочную денормализацию базы.