295.57K
Category: databasedatabase

ER-диаграмма. Области применения диаграмм «сущность-связь»

1.

ER-диаграмма

2.

Схема «сущность-связь» (также ERD или ER-диаграмма) —
это разновидность блок-схемы, где показано, как разные
«сущности» (люди, объекты, концепции и так далее)
связаны между собой внутри системы. ER-диаграммы чаще
всего применяются для проектирования и отладки
реляционных баз данных в сфере образования,
исследования и разработки программного обеспечения и
информационных систем для бизнеса.
2

3.

ER-диаграммы — «родственники» схем структуры
данных (DSD), где вместо связей между самими
сущностями отображаются отношения между
элементами внутри них. ER-диаграммы часто
используются в сочетании с диаграммами DFD,
которые схематично показывают движение потоков
информации в рамках процесса или системы.
3

4.

В ER-моделях и моделях данных обычно выделяют до трех
уровней детализации:
•Концептуальная модель данных — схема наивысшего уровня с
минимальным количеством подробностей. Достоинство этого
подхода заключается в возможности отобразить общую структуру
модели и всю архитектуру системы. Менее масштабные системы
могут обойтись и без этой модели. В этом случае можно сразу
переходить к логической модели.
4

5.

В ER-моделях и моделях данных обычно выделяют до трех
уровней детализации:
•Логическая модель данных содержит более подробную
информацию, нежели концептуальная модель. На этом уровне
определяются более подробные операционные и транзакционные
сущности. Логическая модель не зависит от технологии, в которой
она будет применяться.
5

6.

В ER-моделях и моделях данных обычно выделяют до трех
уровней детализации:
•Физическая модель данных: на основе каждой логической модели
данных можно составить одну или две физических модели. В
последних должно присутствовать достаточно технических
подробностей для составления и внедрения самой базы данных.
6

7.

•Только реляционные данные. Следует четко понимать, что цель
ER-диаграмм — показать связи и отношения между элементами,
поэтому они отображают только реляционную структуру.
•Только для структурированных данных. Данные должны быть
четко разбиты на поля, столбцы и строки, иначе пользы от ERдиаграммы будет мало. Это касается и частично
структурированных данных, так как только некоторые из них будут
пригодны для работы.
•Сложность интеграции с существующей базой данных.
Применение ER-моделей для интеграции с существующей базой
данных — непростая задача по причине различия в архитектурах.
7

8.

Области применения диаграмм «сущность-связь»
Проектирование баз данных. ER-диаграммы применяются для
моделирования и проектирования реляционных баз данных, причем как в
плане логических и бизнес-правил (логические модели данных), так и в
плане внедрения конкретных технологий (физические модели данных). В
сфере разработки программного обеспечения ER-диаграмма, как правило,
служит первым шагом в определении требований проекта по созданию
информационных систем.
8

9.

Области применения диаграмм «сущность-связь»
•Отладка баз данных. ER-диаграммы применяются для анализа уже
имеющихся баз данных с целью выявить и устранить ошибки в логике или
развертывании. Диаграмма позволяет выявить, где именно закрались
ошибки.
9

10.

Области применения диаграмм «сущность-связь»
•Информационные системы для бизнеса. ER-схемы используются для
проектирования и анализа реляционных баз данных, применяемых в
бизнес-процессах. Реляционные базы данных могут пригодиться в любом
бизнес-процессе, где задействованы данные, разбитые на поля, включая
сущности, действия и взаимосвязи. Базы данных помогают оптимизировать
процессы, извлекать данные и повышать качество результатов
10

11.

Области применения диаграмм «сущность-связь»
•Реорганизация бизнес-процессов (BPR). ER-диаграммы помогают
анализировать базы данных, применяемые при реорганизации бизнеспроцессов и моделировании новых баз данных
11

12.

Области применения диаграмм «сущность-связь»
•Образование. Базы данных — широко распространенный в наши дни
способ хранения реляционной информации, применяемой в целях
образования и для последующего извлечения данных, поэтому ERдиаграммы играют не последнюю роль в планировании подобных структур
данных.
12

13.

Области применения диаграмм «сущность-связь»
•Исследовательская деятельность. Поскольку исследовательская работа во
многом опирается на четко структурированные данные, ER-диаграммы
играют ключевую роль в построении оптимальных баз данных для анализа
информации
13

14.

Символы и способы нотации ERD
Диаграммы «сущность-связь» (или ERD) — неотъемлемая составляющая
процесса моделирования любых систем, включая простые и сложные базы
данных, однако применяемые в них фигуры и способы нотации могут
запросто ввести в заблуждение любого.
14

15.

Символы ERD-связей
Связи используются в схемах «сущность-связь» для обозначения
взаимодействия между двумя сущностями. Грамматически связи, как
правило, выражаются глаголами, например, «назначить», «закрепить»,
«отследить», и несут полезную информацию, которую невозможно
получить, опираясь только на типы сущностей
15

16.

Символы ERD-атрибутов
ERD-атрибуты характеризуют сущности, позволяя пользователям лучше
разобраться в устройстве базы данных. Атрибуты содержат информацию о
сущностях, выделенных в концептуальной ER-диаграмме.
16

17.

Символы физических ER-диаграмм
Физическая модель данных — самый детальный уровень ER-схем, где
представлен процесс добавления информации в базу данных. Физические
модели «сущность-связь» отображают всю структуру таблицы, включая
названия столбцов, типы данных, ограничения столбцов, первичные и
внешние ключи, а также отношения между таблицами.
17

18.

Поля
Поля — это участки таблицы, где задаются атрибуты сущностей.
Под атрибутами обычно подразумеваются столбцы базы данных,
которая моделируется по принципу «сущность-связь».
18

19.

Ключи
Ключи — один из способов категоризации атрибутов.
Напоминаем, что ER-диаграммы помогают пользователям
моделировать базы данных посредством таблиц, которые
обеспечивают им упорядоченность, эффективность и высокую
скорость работы. Ну а ключи применяются с целью максимально
эффективно связать между собой разные таблицы в базе
данных.
Первичные ключи
Первичный ключ — это атрибут или сочетание атрибутов,
идентифицирующих один конкретный экземпляр сущности.
Внешние ключи
Внешний ключ создается каждый раз, когда атрибут
привязывается к сущности посредством единичной или
19
множественной связи.

20.

Типы
Под типом подразумевается тип данных в
соответствующем поле таблицы. Однако это также
может быть и тип сущности, то есть описание ее
составляющих.
20

21.

Нормализация
Нормализация представляет процесс разделения данных по отдельным
связанным таблицам. Нормализация устраняет избыточность данных (data
redundancy) и тем самым избежать нарушения целостности данных при их
изменении, то есть избежать аномалий изменения (update anomaly).
В ненормализованной форме таблица может хранить информацию о двух и более
сущностях. Также она может содержать повторяющиеся столбцы. Также столбцы
могут хранить повторяющиеся значения. В нормализованной же форме каждая
таблица хранит информацию только об одной сущности.
21

22.

Нормализация
Нормализация предполагает применение нормальных форм к структуре
данных. Существуют 7 нормальных форм. Каждая нормальная форма (за
исключением первой) подразумевает, что к данным уже была применена
предыдущая нормальная форма. Например, прежде чем применить третью
нормальную форму к данным должна быть применена вторая нормальная
форма. И строго говоря, база данных считается нормализованной, если к
ней применяется третья нормальная форма и выше.
22

23.

Нормализация
Первая нормальная форма (1NF) предполагает, что сохраняемые данные
на пересечении строк и столбцов должны представлять скалярное
значение, а таблицы не должны содержать повторяющихся строк.
Вторая нормальная форма (2NF) предполагает, что каждый столбец, не
являющийся ключом, должен зависеть от первичного ключа.
Третья нормальная форма (3NF) предполагает, что каждый столбец, не
являющийся ключом, должен зависеть только от первичного ключа.
23

24.

Нормализация
Нормальная форма Бойса-Кодда (BCNF) является немного более строгой версией третьей
нормальной формы.
Четвертая нормальная форма (4NF) применяется для устранения многозначных
зависимостей (multivalued dependencies) - таких зависимостей, где столбец с первичным
ключом имеет связь один-ко-многим со столбцом, который не является ключом. Эта
нормальная форма устраняет некорректные отношения многие-ко-многим.
Пятая нормальная форма (5NF) разделяет таблицы на более малые таблицы для
устранения избыточности данных. Разбиение идет до тех пор, пока нельзя будет
воссоздать оригинальную таблицу путем объединения малых таблиц.
Шестая нормальная форма (domain key normal form / 6NF). Каждое ограничение в связях
между таблицами должно зависеть только от ограничений ключа и ограничений домена,
где домен представляет набор допустимых значений для столбца. Эта форма
предотвращает добавление недопустимых данных путем установки ограничения на уровне
отношений между таблицами, но не на уровне таблиц или столбцов. Данная форма, как
правило, не применима на уровне СУБД, в том числе и в SQL Server.
24

25.

Ключевым понятием нормализации является функциональная зависимость.
Функциональная зависимость описывает связь между атрибутами отношения. Например,
если атрибут В функционально зависит от атрибута А (А → В), то каждое значение
атрибута А связано только с одним значением атрибута В. Причем атрибуты А и В могут
состоять из одного или нескольких атрибутов. То есть, если две строки имеют одно и то же
значение атрибута А, то они обязательно имеют одно и то же значение атрибута В. При
этом для одного значения атрибута В могут существовать несколько различных значений
атрибута А. Атрибут А в этой зависимости еще называется детерминантом.
25
English     Русский Rules