710.88K
Category: databasedatabase

Основные принципы структуризации и нормализации базы данных

1.

Основные принципы
структуризации и
нормализации базы данных.

2.

Что такое нормализация БД
Под нормализацией понимают процесс организации
данных в базе определённым образом в
соответствии с рекомендациями по
проектированию.

3.

Преимущества:
•Пользователь может получить нужную ему информацию,
используя только простые запросы.
•Существенно снижается вероятность потери данных, а также
минимизируется возможное искажение информации.
•Если всё делать по правилам, то в дальнейшем не будет
проблем с наращиванием БД.
•Можно избежать избыточности (дублирования данных), что
позволит оптимизировать размер БД (будет занимать меньше
места).
•Нормализация позволяет убрать несогласованные
зависимости, которые существенно замедляют доступ к
данным, хранящимся в базе.

4.

Атрибут. Под этим термином в большинстве случаев понимается поле таблицы.
Однако в книгах подаётся определение немного иное — «свойство некой
сущности».
Домен атрибута. Характеристика домена атрибута включает в себя разрешенные
варианты значений, которые атрибут может принимать. Обычно таких значений
бывает множество.
Кортеж. Термин «кортеж» обозначает набор атрибутов, описывающих
конкретный объект или сущность. Как правило, кортеж ассоциируется с строкой
в таблице данных.
Отношение. Представляет собой готовую таблицу, то есть, набор уже
сформированных кортежей.
Схема отношения. Описывает структуру таблицы и включает в себя набор
определенных полей.
Проекция. Представляет собой таблицу, полученную путем перестановки
некоторых атрибутов.
Аномалия. Это ситуация в таблице, которая может привести к противоречиям в
базе данных и значительно усложнить ее обработку. Существуют аномалии
модификации, удаления и добавления.

5.

6.

1НФ
Первая нормальная форма (1НФ)
предполагает, что все атрибуты в таблице
должны быть простыми, а данные на
пересечении строк и столбцов должны иметь
исключительно скалярные значения. Важным
требованием также является отсутствие
дублирующих строк.

7.

8.

9.

2НФ
Вторая нормальная форма подразумевает, что
отношение будет соответствовать ей в
полной мере только при условии, что база
данных уже находится в первой нормальной
форме, и каждый столбец (не являющийся
ключом) зависит от первичного ключа.

10.

11.

12.

3НФ
Третья нормальная форма предполагает, что
вся таблица должна находиться в 2НФ, но
любой неключевой столбец при этом
обязательно должен зависеть только от
первичного ключа. Ниже будет представлена
таблица, в которой атрибут с первичным
ключом слово «Модель», а атрибут «Телефон»
от ключа никак не зависит – отсюда ошибка.

13.

14.

15.

Аномалия вставки
Аномалия вставки проявляется в случаях, когда нужно добавить
данные к таблице. Здесь может возникнуть ситуация, когда для
вставки данных нужно добавлять (выгадывать) лишние
(несуществующие) данные. Иными словами, в базу данных
невозможно записать данные об одной сущности, не указав данных
о другой сущности. Значит, аномалия вставки – это добавление
нежелательной или несуществующей (выдуманной) информации об
одной сущности в момент вставки информации о другой сущности.

16.

17.

Аномалия редактирования
Аномалия редактирования возникает в случаях, когда в таблице базы
данных существуют повторяющиеся данные. Такие данные тяжело
обновлять при их редактировании, поскольку нужно вносить
изменения во все ячейки таблицы, в которых эти данные фигурируют.
Если при изменении повторяемых данных в одной ячейке не изменить
так же эти данные в других ячейках, то компьютер будет воспринимать
эти данные как разные (в отличие от человека).
Аномалия редактирования – это вынужденная необходимость
изменения (обновления) данных во всей таблице в случае их
изменения (обновления) в одной ячейке таблицы с целью избежание
их двузначного трактования.

18.

19.

Аномалия удаления
Аномалия удаления проявляется в случаях, когда нужно удалить
данные из таблицы.
Аномалия удаления – это потеря одних данных в таблице при
удалении других данных в таблице.

20.

21.

Правильное применение механизма нормализации к базе данных дает
следующие взаимосвязанные преимущества:
- минимизируются затраты на сохранение данных (избыточность
данных). Другими словами, уменьшается размер базы данных;
- с возрастанием размера базы данных не так заметно возрастают
временные затраты на доступ к данным;
- отсутствуют аномалии модификации в базе данных. К аномалиям
модификации относятся аномалии вставки, редактирования и удаления
данных.
English     Русский Rules