Лекция 2: Основные Модели данных
Типология хранения данных
Типология хранения данных
Типология хранения данных
Типология хранения данных
Типология хранения данных
Понятие модели данных
Понятие модели данных
Модель представления данных
Модель представления данных
Модель представления данных
Модель представления данных
Реляционная модель базы данных
Реляционная модель базы данных
Реляционная модель базы данных
Глоссарий
Реляционная модель базы данных
Реляционная модель базы данных
0.96M
Category: databasedatabase

Лекция 2_Основные модели данных

1. Лекция 2: Основные Модели данных

ЛЕКЦИЯ 2:
ОСНОВНЫЕ МОДЕЛИ
ДАННЫХ
Типология хранения данных: локальные, централизованные,
распределенные БД. Понятие модели данных. Модель представления
данных: иерархическая, сетевая, реляционная и другие модели.

2. Типология хранения данных

Классификация БД. Классификация БД может быть произведена по различным
признакам, среди которых выделяют:
■По форме представления информации: фактографические и документальные.
■По типу используемой модели данных: иерархические, сетевые, реляционные.
■По типологии хранения данных: локальные, централизованные и распределённые
(удалённые) БД.
Основные подходы к хранению данных.
Полнота данных – база данных должна обеспечивать полное и адекватное
описание предметной области. При этом должен соблюдаться принцип
минимальной избыточности. Особое внимание на полноту обращается на этапе
проектирования базы данных.
Непротиворечивость данных – данные, которые хранятся в базе данных, должны
проверяться на правильность при вводе, существует запрет на дублирование
данных.

3. Типология хранения данных

Целостность данных:
■при описании связей должна обеспечиваться правильность ссылок между
таблицами, что обеспечивается каскадным обновлением и удалением;
■блокировка модифицируемых записей, при одновременной работе с БД;
■механизм транзакций (последовательность операций над БД), позволяющий
вернуться на несколько шагов назад, отменив последние действия, осуществив
«откат».
Основываясь на физическом представлении организации хранения данных,
можно выделить следующие виды архитектуры для хранения данных:
■Локальные базы данных. Располагаются на компьютере, на котором работает
пользователь. Вся информация используется в монопольном режиме.
Пользователь сам регулирует доступ к данным.
■Централизованные базы данных. Централизованная база данных хранится на
центральном компьютере, пользователи и прикладные программы имеют
удаленный доступ к базе данных.

4. Типология хранения данных

Централизованные базы данных
реализуются на базе двух архитектур с
сетевым доступом:
■Архитектура «файл – сервер»
предполагает выделение одной из
машин в сети в качестве центральной
(сервер файлов), на которой хранится
совместно используемая
централизованная база данных.
Остальные машины сети исполняют
роль рабочих станций, на которых в
основном и производится обработка
данных, получаемых в виде файлов
базы данных в соответствии с
запросами пользователей.
Центральный сервер выполняет в
основном только роль хранилища
файлов, не участвуя в обработке
самих данных;

5. Типология хранения данных

Централизованные базы данных реализуются
на базе двух архитектур с сетевым доступом:
■Архитектура «клиент – сервер» - сервер
владеет и распоряжается информационными
ресурсами системы, а клиент пользуется ими.
Центральная машина (сервер базы данных)
помимо хранения базы данных обеспечивает
выполнение основного объема обработки
данных. Приложение-клиент формирует запрос
к серверу, на структурном языке запросов SQL
(Structured Query Language. Удаленный сервер
принимает запрос и переадресует его SQLсерверу БД, который обеспечивает
интерпретацию запроса, его выполнение в
базе данных, формирование результата
выполнения запроса и выдачу его
приложению-клиенту.

6. Типология хранения данных

Распределенные базы данных.
Распределенная база данных
предполагает хранение и
управление данными в нескольких
узлах компьютерной сети и
передачу данных между ними в
процессе выполнения запросов.
На разных компьютерах могут
храниться не только различные
таблицы, но и разные фрагменты
одной огромной таблицы. При этом
для пользователя не имеет
значения, как организовано
хранение данных.

7. Понятие модели данных

Модель данных –некоторая
абстракция, в которой отражаются
самые важные аспекты
функционирования выделенной
части предметной области, а
второстепенные – игнорируются.
Модель данных включает набор
понятий для описания данных,
связей между ними и ограничений,
накладываемых на данные.

8. Понятие модели данных

Итак, модель данных состоит из трёх частей:
1. Набор типов структур данных.
■Здесь можно провести аналогию с языками программирования, в которых тоже есть
предопределённые типы структур данных, такие как скалярные данные, векторы, массивы,
структуры (например, тип struct в языке Си) и т.д.
2. Набор операторов или правил вывода, которые могут быть применены к любым правильным
примерам типов данных, перечисленных в (1), чтобы находить, выводить или преобразовывать
информацию, содержащуюся в любых частях этих структур в любых комбинациях.
■Такими операциями являются: создание и модификация структур данных, внесение новых
данных, удаление и модификация существующих данных, поиск данных по различным условиям.
3. Набор общих правил целостности, которые прямо или косвенно опреде- ляют множество
непротиворечивых состояний базы данных и/или мно- жество изменений её состояния.
■Правила целостности определяются типом данных и предметной областью. Например,
значение атрибута Счётчик является целым числом, т.е. может состоять только из цифр. А
ограничения предметной области таковы, что это число не может быть меньше нуля.

9. Модель представления данных

Иерархическая модель данных
это модель, в которой абстрактные
понятия находятся в отношении
предшествования таким образом,
что каждому понятию соответствует
только один предшественник
(родитель). Предполагает
организацию данных в виде
древовидной структуры. На самом
верхнем уровне структуры
находится корень дерева, не
имеющий вышестоящих узлов.
Остальные узлы связаны между
собой через исходный узел,
находящийся выше.
Основным недостатком ИМД
является дублирование данных.

10. Модель представления данных

Сетевая модель данных
Необходимость сетевой модели
проявляется тогда, когда одни и те
же конкретные данные в рамках
одной и той же предметной области
классифицируются не одной, а
несколькими системами
классификации. Т.е предполагает
организацию данных в виде сетевой
структуры, когда любой элемент
может быть связан с любым другим
элементом.
■Достоинство сетевых МД: данные
имеют четкую структуру.
■Недостатком сетевых МД является
большое количество дополнительной
информации о связях.

11. Модель представления данных

Реляционная модель данных
– это модель, в которой данные
можно представить в виде отношений,
изменяющихся во времени.
Реляционная модель была
предложена в 1969 году сотрудником
фирмы IBM Е. Ф. Коддом.
Недостатки реляционной модели
данных:
■модель не допускает представления
объектов со сложной структурой,
поскольку в ее рамках возможно
моделирование лишь с помощью
двумерных таблиц.
■Данные об объектах содержатся, как
правило, во многих таблицах, что
значительно замедляет обработку
данных.

12. Модель представления данных

Другие модели данных. В последнее
время при разработке БД активно
используются такие модели, как
объектно-ориентированная, объектнореляционная и многомерная модели.
Ознакомиться самостоятельно из КЛ!

13. Реляционная модель базы данных

Принципы реляционной модели были
заложены в 1969–1970 гг.
американским ученым Э. Коддом (E.F.
Codd). Будучи математиком по
образованию, Э. Кодд предложил
использовать для обработки данных
аппарат теории множеств
(объединение, пересечение, разность,
декартово произведение). Он показал,
что любое представление данных
сводится к совокупности двумерных
таблиц особого вида, известного в
математике как отношение – relation
(англ.).
■Основными понятиями реляционных
баз данных являются: тип данных,
домен, атрибут, кортеж, отношение,
первичный ключ.

14. Реляционная модель базы данных

■ Сущность есть объект любой природы,
данные о котором хранятся в базе
данных. Данные о сущности хранятся в
отношении.
■ Отношение представляет собой
двумерную таблицу, содержащую
некоторые данные.
■ Строки таблицы-отношения называются
кортежами, а столбцы атрибутами
■ Все данные, помещенные в одной
строке, называют записью, каждый
элемент записи – это поле.
■ Степень отношения – это количество
атрибутов отношения.
■ Кардинальное число отношения –
количество кортежей в отношении.
■ Домен – множество допустимых
значений атрибута. Все элементы
домена относятся к одному типу данных
и отвечают некоторому логическому
условию (ограничению на диапазон
значений).

15. Реляционная модель базы данных

■ Ключ отношения – это атрибут (группа
атрибутов), значения которого
классифицируют или идентифицируют
кортеж.
■ Первичный ключ идентифицирует
экземпляр сущности, его значение
должно быть уникальным (unique) и
обязательным (not null).
■ Количество строк в таблице (кортежей
в отношении) называется мощностью
отношения, количество столбцов
(атрибутов) – арностью.
■ внешний ключ (foreign key). Внешний
ключ предназначен для хранения
значения первичного ключа другой
таблицы с целью организации связи
между этими таблицами.

16. Глоссарий

Реляционный термин
Соответствующий «табличный» термин
База данных
Набор таблиц
Схема базы данных
Набор заголовков таблиц
Отношение
Таблица
Заголовок отношения
Заголовок таблицы
Тело отношения
Тело таблицы
Атрибут отношения
Наименование столбца таблицы
Кортеж отношения
Строка таблицы
Степень (-арность) отношения
Количество столбцов таблицы
Мощность отношения
Количество строк таблицы
Домены и типы данных
Значения и типы данных в ячейках таблицы

17. Реляционная модель базы данных

В реляционных СУБД для указания связей таблиц производят операцию их
связывания.
Все информационные объекты предметной области связаны между собой.
Соответствия, отношения, возникающие между объектами предметной
области, называются связями. При связывании двух таблиц выделяют
основную и дополнительную (подчиненную) таблицы.
Возможны следующие отношения между таблицами:
■Отношение «один – ко – многим» (обозначают 1:М): одной записи из главной
таблицы может соответствовать ноль, одна или несколько записей подчинённой
таблицы.
■Отношение «один – к - одному» (обозначают 1:1): одной записи из главной
таблицы соответствует только одна запись из подчинённой таблицы.
■Отношение «многие – ко – многим» (обозначают m:n): это связь, при которой
множественным записям из одной таблицы (A) могут соответствовать
множественные записи из другой (B).

18. Реляционная модель базы данных

■ Связи «один к одному» встречаются достаточно редко, в основном, между
сущностями надтипов и подтипов. Например, связь типа «один-к-одному» может
использоваться между сотрудниками и их служебными автомобилями. Каждый
работник указан в таблице «Сотрудники» только один раз, как и каждый автомобиль
в таблице «Служебный транспорт».
■ Связи «один ко многим» более часты. «В счете перечислено множество товаров»,
«Торговый агент выписывает много счетов». Машина и ее части. Каждая часть
машины единовременно принадлежит только одной машине, но машина может
иметь множество частей. Кинотеатры и экраны. В одном кинотеатре может быть
множество экранов, но каждый экран принадлежит только одному кинотеатру.

Связи «многие ко многим», хотя и не столь широко распространены, как «один ко
многим», также не редкость. (Пример: «покупатель покупает товары», «студент
изучает предметы»). Примером такой связи может служить школа, где учителя
обучают учащихся. В большинстве школ каждый учитель обучает многих учащихся,
а каждый учащийся может обучаться несколькими учителями. Связи «многие ко
многим» невозможно непосредственно реализовать в реляционной модели, однако
их косвенная реализация вполне проста и однозначна.
English     Русский Rules