Similar presentations:
Информатика и базы данных. Проектирование баз данных (тема № 2)
1. Информатика и базы данных
Москин Николай ДмитриевичИнститут математики и информационных
технологий, ПетрГУ
1
2. § 2 Проектирование баз данных
60-е годы – начало исследований иразработок в области проектирования,
создания и использования баз данных.
База данных (БД) – это именованная
совокупность данных, отражающая состояние
объектов и их отношений в рассматриваемой
предметной области.
Предметная область – это часть реального
мира, совокупность реальных объектов,
которые представляют интерес для
исследователя.
2
3. Предметная область
При определении предметной области должныбыть решены вопросы:
О каких объектах или явлениях реального мира
требуется накапливать и обрабатывать
информацию?
Какие их характеристики и какие взаимосвязи
между ними будут учитываться?
3
4. Проектирование БД
Проектирование базы данных делится на дваэтапа:
Построение инфологической (информационнологической) модели;
Построение даталогической модели.
4
5. Инфологическая модель
Инфологическая модель (модель предметнойобласти) – это описание предметной области,
выполненное без ориентации на используемые в
дальнейшем программные или технические
средства.
Для описания предметной области чаще всего
используют модель «сущность-связь» («EntityRelationship» или ER-модель).
5
6. ER-модель
Рассмотрим построение ER-модели на примересведений личных дел рабочих некоторой фирмы.
Каждое личное дело, заводящееся на рабочего
при его первом поступлении на работу в фирме,
открывает «титульный лист», где фиксируется
его номер, имя, отчество и фамилия, возраст,
семейное положение и т. д.
6
7. Атрибуты
В результате анализа необходимо выявить основныеинформационные объекты, или сущности,
информация о которых имеется в источниках. У
информационных объектов есть определенные
свойства – атрибуты. Сущность – это тип, или
класс, объектов; конкретные объекты каждого класса
называются экземплярами.
Уникальный, однозначно определяющий объект
атрибут называется идентификатором или
ключевым атрибутом (см. номер личного дела).
7
8.
РабочийСемейное
положение
Номер личного
дела
……
ФИО
Возраст
Место работы
Между сущностями могут существовать
отношения, называемые связями.
8
9. Виды связей
Характеристики однозначности для бинарныхсвязей:
Связь «один-к-одному» (1:1). Каждому объекту из
первого класса соответствует ровно один объект
из второго класса.
Институт
возглавляет
Директор
9
10. Виды связей
Связь «один-ко-многим» (1:N). Одному объектуиз первого класса соответствует несколько
объектов из второго класса, но каждому объекту
второго класса соответствует только один объект
первого класса.
Студент
состоит
Группа
10
11. Виды связей
Связь «многие-ко-многим» (M:N). Одномуобъекту из первого класса соответствует
несколько объектов из второго класса и
наоборот.
Преподаватель
ведет
Предмет
11
12. Характеристики связей
Обязательная по отношению к классу связьозначает, что существование объектов класса
зависит от наличия связи.
Пример 1: Институты и компьютерные классы
независимы.
Компьютерный
класс
имеет
Институт
12
13. Характеристики связей
Пример 2: Каждый сотрудник имеетдолжность, но должность может быть
вакантной.
Служащий
занимает
должность
13
14. Характеристики связей
Пример 3: Студент всегда состоит в какой-тогруппе и не существует группа без студентов.
Студент
состоит
Группа
14
15. Даталогическая модель
Даталогическое проектирование сводится кпредставлению инфологической модели в
терминах выбранной системы управления
базами данных (СУБД), т. е. даталогическая
модель описывает собственно данные
(информацию, которая будет записана в памяти
компьютера) и связи между данными.
Каждая СУБД опирается на определенную
модель данных. Наиболее популярной в
настоящее время является реляционная модель
данных.
15
16. Реляционная модель
Все данные в реляционной модели представляются ввиде таблиц. Каждая сущность может быть
представлена отдельной таблицей, строки которой
соответствуют экземплярам сущности, а столбцы –
атрибутам.
Связи между сущностями в реляционной модели
задаются через ключевые поля. Связь «один-кодному» означает совпадение ключевых полей
таблиц, которые являются равноправными. Связь
«один-ко-многим» означает, что одна таблица
является главной, а вторая – подчиненной.
16
17. Инфологическая модель
Символы "1" и "N" показывают выбранный тип связи– "один-ко-многим" (обозначается "1:N").
17
18. Даталогическая модель
Поле "Номер предприятия" входит как ключевоеполе в первую таблицу и как неключевое – во
вторую таблицу (в подчиненной таблице оно
называется вторичным, или внешним ключом).
18
19. Целостность
Способность базы данных отражатьинформацию предметной области адекватно,
т.е. полно и непротиворечиво, называется
целостностью.
Для обеспечения целостности следует избегать
избыточности данных и соблюдать так
называемые ограничения целостности.
Под избыточностью понимается дублирование
данных. Например, добавление поля «Название
предприятия» в таблицу «Члены правлений»
будет избыточным.
19
20. Избыточность
Дублирование нежелательно не потому, чтоповторяющиеся данные увеличивают объем
базы (современные пользователи, как правило,
уже не сталкиваются с проблемой экономии
дискового пространства).
Дело в том, что если данные повторяются, то
любые исправления придется повторять столько
раз, сколько таких повторов встречается в базе
данных.
20
21. Ограничения целостности
Ограничения целостности означают:должны выполняться простейшие условия для
данных (например, в числовое поле нельзя вводить
текст или длина текстового поля не может превышать
определенного значения).
непротиворечивость данных. Например,
запрещаются повторы значений в ключевом поле, так
как ключевое поле служит идентификатором записей.
Завершив создание даталогической модели, можно
приступать к конструированию таблиц и вводу
данных.
21