3.71M
Category: databasedatabase

Основы проектирования баз данных. Тема 2. Взаимосвязи в моделях и реляционный подход к построению моделей

1.

Основы проектирования
Баз данных
Тема 2. Взаимосвязи в моделях и
реляционный подход к построению моделей
Американским комитетом по стандартизации AN
SI (American National Standards Institute)
была предложена трехуровневая система органи
зации БД.

2.

ЛОГИЧЕСКАЯ НЕЗАВИСИМОСТЬ
ФИЗИЧЕСКАЯ НЕЗАВИСИМОСТЬ
Логическая нез
ависимость - в
озможность изм
енения одного
приложения без
корректировки
других приложе
ний, работающи
х с этой же ба
зой данных
Физическая независ
имость - возможнос
ть переноса
хранимой информаци
и с одних носителе
й на другие при со
хранении
работоспособности
всех приложений, р
аботающих с данной
базой данных
Уровень внешних моделей - уровень на котором опре
деляется видение БД отдельных приложений. Каждое
приложение видит и обрабатывает только те данные,
которые необходимы именно этому приложению.
Концептуальный уровень — центральное управляющ
ее звено, здесь база данных представлена в наиболее
общем виде, который объединяет данные, используе
мые всеми приложениями, работающими с данной б
азой данных. Фактически концептуальный уровень от
ражает обобщенную модель предметной области (об
ъектов реального мира), для которой создавалась баз
а данных. Как любая модель, концептуальная модель
отражает только существенные, с точки зрения обраб
отки,
особенности
объектов
реального
мира.
Физический уровень — собственно данные, распо
ложенные в файлах или в страничных структурах,
расположенных на внешних носителях информац
ии.

3.

Типы моделей данных
Модель данных (МД) – совокупность правил п
орождения структур данных в базе данных, о
пераций над ними, а также ограничений цело
стности, определяющих допустимые связи и з
начения данных, последовательность их изме
нения.
Самой первой МД, которая использовалась дл
я построения концептуальных схем была иерар
хическая модель. Вслед за ней появились сетев
ые модели. Потом ER-модели, и, как итог разви
тия моделей, возникли реляционные и пострел
яционные модели. Каждая из перечисленных
моделей имеет свои достоинства и недостатки.
Иерархическая модель данных (ИМД) – это
модель, в которой абстрактные понятия нах
одятся в отношении предшествования таким
образом, что каждому понятию соответствуе
т только один предшественник (родитель).
Только одна часть, называемая корнем моде
ли, не имеет предшественника.
Иерархическая БД состоит из упорядоченног
о набора деревьев; или, более точно, из у
порядоченного набора нескольких экземпляр
ов одного типа дерева.
Примерами типичных операторов манипулирова
ния иерархически организованными данными м
огут быть следующие:
· найти указанное дерево;
· перейти от одного дерева к другому;
· перейти от одной записи к другой внутри
дерева;
· перейти от одной записи к другой в поряд
ке обхода иерархии;
· вставить новую запись в указанную позици
ю;
· удалить текущую запись.
Достоинство ИМД: данные, отражающие общие свойства
совокупности конкретных данных не дублируются. Недост
аток ИМД связан с дублированием данных в случае их од
нотипности.

4.

Если в иерархических структурах записьпотомок должна иметь ровно одного предка
, то в сетевых структурах данных потомок
может иметь любое число предков. Связи м
ежду записями в сетевой МД выполняются в
виде указателей, то есть каждая запись х
ранит ссылку на другую однотипную запись
(или признак конца списка) и ссылки на с
писки подчиненных записей.
Достоинство сетевых МД: данные имеют четкую структ
уру.
Недостатком сетевых МД является большое количеств
о дополнительной информации о связях.
Реляционная модель данных (РМД) – это м
одель, в которой данные можно представит
ь в виде отношений, изменяющихся во врем
ени. Традиционно в реляционных системах
отношением называют таблицу, кортежем –
строку таблицы, а атрибутом – столбец. П
ри этом атрибуты имеют уникальные имена
в рамках одного отношения.
Достоинство реляционной модели заключается в прос
тоте для понимания, наглядности и удобстве физическо
й реализации на ЭВМ.
Недостатки реляционной модели данных: модель не
допускает представления объектов со сложной структу
рой, поскольку в ее рамках возможно моделирование
лишь с помощью двумерных таблиц. Данные об объект
ах содержатся, как правило, во многих таблицах, что зн
ачительно замедляет обработку данных

5.

Объектно-ориентированная модель данных (
ООМД) представляет структуру, которую мож
но изобразить графически в виде дерева, у
злами которого являются объекты.
а - реляционная модель;
б - постреляционная модель
Постреляционная модель данных в общем сл
учае представляет собой расширенную реля
ционную модель, снимающую ограничение не
делимости значений полей. То есть, допус
каются многозначные поля, значения котор
ых состоят из подзначений. Набор значени
й многозначных полей считается самостоят
ельной таблицей, встроенной в основную.
Достоинство постреляционной модели данных: возмож
ность представления связанных реляционных таблиц одн
ой постреляционной таблицей.
Недостаток постреляционной модели: сложность в обес
печении целостности данных.
Каждый объект характеризуется уникальны
м идентификатором, состоянием и поведен
ием. Состояние объекта определяется множ
еством значений его свойств (атрибутов). По
ведение объекта описывают методы, называ
емые процедурами. То есть, составной часть
ю описания объекта являются процедуры, сп
особные производить действия над атрибут
ами объекта в случае наступления тех или и
ных событий. Объекты могут объединяться в
классы. Экземпляры одного класса отличают
ся лишь значениями своих свойств, но не св
оими методами. Методы устанавливаются п
ри определении класса.
Основным достоинством ООМД является способность от
ображать информацию о сложных объектах. Эта модель
обычно применяется для сложных предметных областей,
при моделировании которых не хватает функциональнос
ти реляционной модели. Недостаток ООМД: неудобство
обработки больших массивов данных.

6.

Объектно-реляционная модель данных (ОРМД
) является гибридной моделью, сочетающей
возможности реляционной модели с объектны
ми свойствами данных. В ОРМД используются
такие объектно-ориентированные компоненты
, как инкапсуляция, полиморфизм, наследов
ание и т.п. Отличительная особенность объ
ектно–реляционной модели от ООМД состоит
в том, что она основана на стратегии реля
ционной модели.
Многомерная модель предназначена для анали
тической обработки информации. В данной мо
дели используются такие понятия, как агрег
ируемость, историчность, прогнозируемость
данных. Агрегируемость данных - возможност
ь их рассмотрения с различным уровнем обоб
щения.
Историчность обеспечивает высокий уровень
статичности (неизменяемости) данных и их в
заимосвязей, а также, в обязательном поряд
ке, привязку данных к временным точкам. Пр
огнозируемость данных - задание функций пр
огнозирования и применение их к различным
интервалам времени.
Основные понятия в многомерной модели – измерение и яч
ейка. Измерение многомерной модели – это множество одн
отипных данных, образующих одну из граней многомерного
гиперкуба. Примеры наиболее часто используемых временн
ых измерений – дни, месяцы, кварталы и годы. Ячейка мног
омерной модели – это поле, значение которого однозначно
определяется фиксированным набором измерений. Тип пол
я чаще всего определен цифрой.
Недостаток этой модели состоит в громоздкости в случае ее
использования для решения стандартных задач оперативн
ой обработки.

7.

Реляционная модель данных

8.

9.

10.

ФУНДАМЕНТАЛЬНЫЕ СВОЙСТВА ОТНОШЕНИЙ

11.

Реляционная алгебра
Основы реляционной алгебры были заложены Э
. Коддом. Реляционная алгебра задает набор
операторов для выполнения операций над рел
яционными отношениями. Операции реляционно
й алгебры Кодда можно разделить на две гру
ппы: базовые теоретико-множественные и спе
циальные реляционные.
Объединение (UNION) двух совместимых отношений R1 и R
2 одинаковой размерности – это отношение R, содержащее
все элементы исходных отношений. Повторяющиеся корте
жи не включаются.
Пересечение (INTERSECT) двух совместимых по типу отнош
ений R1 и R2 одинаковой размерности – это отношение R с
телом, включающим в себя кортежи, одновременно прина
длежащие обоим отношениям
Вычитание (MINUS) двух совместимых по типу отношений
R1 и R2 одинаковой размерности – это отношение R с тело
м, состоящим из множества всех кортежей, принадлежащи
х отношению R1 и не принадлежащих отношению R2.

12.

Декартово произведение отношений (TIMES) – это бинарны
й оператор, предназначенный для комбинирования двух от
ношений. Пусть R1- отношение степени k1 , а R2- отношени
е степени k2. R = R1 х R2 будет представлять собой множест
во кортежей таких, что первые k1 элементов кортежа отно
шения R составляют кортежи отношения R1, а последующи
е k2 элементов кортежа из R составляются кортежами из R2.
Сочетание кортежей из R1 и R2 при образовании кортежа R
осуществляется по правилам декартова произведения. Зде
сь R1 и R2 могут иметь разные схемы. Степень отношения R
равна сумме степеней отношений операндов R1 и R2. Мощ
ность отношения R равна произведению мощностей R1 и R
2.
Специальные реляционные операторы
Выборка (R WHERE f) отношения R по формуле f представля
ет собой новое отношение, заголовок которого совпадает с
заголовком отношения R, а тело содержит множество корте
жей, являющихся подмножеством множества кортежей отн
ошения R, для которых формула f принимает значение исти
на. Здесь f – логическая формула (предикат), принимающая
значение «истина» или «ложь», образованная операндами,
представляющими собой имена атрибутов отношений R ил
и литералы, а также скалярными операторами сравнения (=
, <>,>, <, >=, <=) и логическими операторами И, ИЛИ, НЕ. Выб
ор – унарная операция.

13.

Проекция отношения R по атрибутам X, Y, …, Z обозначается
R [X, Y, …, Z], где каждый из указанных атрибутов принадле
жит отношению R, – это отношение с заголовком { X, Y, …, Z }
и телом, содержащим кортежи отношения R, за исключени
ем повторяющихся кортежей. Повторение одинаковых атри
бутов в списке X, Y, …, Z запрещается.
С помощью оператора проекции получается «в
ертикальное» подмножество атрибутов отноше
ния R с последующим исключением дублирующи
х кортежей (если они возникают).
Соединение – операция реляционной алгебры, связывающ
ая таблицы. Операция соединения используется для связыв
ания данных между таблицами. Это, возможно, наиболее в
ажная функция любого языка баз данных. ТЭТА–соединени
е отношений. Пусть отношения R1 и R2 не имеют атрибутов
с одинаковыми именами, а символ Θ (греческая буква тэта)
обозначает один из операторов сравнения: =, <>, >, <, <=, >=
. Тогда Θ–соединением отношения R1 по атрибуту Х с отно
шением R2 по атрибуту Y является отношение, кортежи кот
орого получаются в результате декартова произведения отн
ошений R1 и R2 и для которых условие X Θ Y принимает зна
чение истина. Другими словами, ТЭТА–соединение это (R1
TIMES R2) WHERE XΘY.
R1 TI
MES R
2) WH
ERE X
≥ Y

14.

Частным случаем соединения являются эквисоединение и
естественное соединение. Операция эквисоединения хара
ктеризуется тем, что оператор сравнения в этом соединени
и – это знак равенства. Операция естественного соединени
я (операция R1 JOIN R2) применяется к двум отношениям,
имеющим общий атрибут (простой или составной). Этот ат
рибут в отношениях имеет одно и то же имя (совокупность
имен) и определен в одном и том же домене (доменах)
Деление отношения. Пусть R1 и R2 – два отношения. Тогда
отношение R := R1/R2 может быть получено следующим об
разом: 1. Результирующее отношение R будет содержать то
лько те атрибуты делимого R1, которых нет в делителе R2. 2
. В результирующее отношение R включаются только те нед
ублирующиеся кортежи из R1, декартово произведение кот
орых с делителем R2 содержится в делимом (является под
множеством делимого).
Существует 3 вида взаимосвязей : ассоциация, обобщение
и агрегация.
Ассоциация — обозначает наличие логической связи межд
у объектами. С каждой ассоциацией связано понятие мощн
ости, которое может принимать одно из следующих значен
ий: 1:1, 1:М и M:N. Мощность обозначает количество объек
тов определенного типа, которые будут участвовать в связи.

15.

связь «один к одному» устанавливается в случаях, когда конкретная
строка главной таблицы в любой момент времени связана только с од
ной строкой подчиненной таблицы;
связь «один ко многим» устанавливается в случаях, когда конкретна
я строка главной таблицы в любой момент времени связана с несколь
кими строками подчиненной таблицы; при этом любая строка подчине
нной таблицы связана только с одной строкой главной таблицы;
связь «многие ко многим» устанавливается в случаях, когда конкрет
ная строка главной таблицы в любой момент времени связана с неско
лькими строками подчиненной таблицы и в то же время одна строка п
одчиненной таблицы связана с несколькими строками.
English     Русский Rules