Similar presentations:
Базы данных
1. Базы данных
ПреподавательТокаревская Светлана Анатольевна
2. Литература:
2Литература:
Голицына О.Л., Максимов Н.В., Попов И.И. Базы
данных. 2007.
Ямова Т.Н. Практикум по базам данных. 2009.
3. План работы:
1. Модели данных.2. Проектирование баз данных.
3
3. Разработка запросов к базе данных.
4. СУБД MS Access.
5. СУБД MS Visial Fox Pro.
4.
Основные понятия4
База данных (БД) – совместно используемый набор
логически связанных данных (и их описание),
предназначенный для удовлетворения информационных
потребностей организации.
Система управления базами данных (СУБД) –
программное обеспечение, с помощью которого
пользователи
могут
определять,
создавать
и
поддерживать базу данных, а также получать к ней
контролируемый доступ.
5.
История развития компьютеризацииТехнический период (≈ с 1946 по 1964 г.)
Программный период (с 1954 по 1970 г.)
4
Информационный период (с 1970 по наст.время)
Гуманитарный период (с начала 90-х гг. прошлого века)
6. Модели данных
Уровни представления данных:• Концептуальный;
• Внутренний (физический);
6
• Внешний.
Модель данных (МД) – это некоторая абстракция, которая
позволяет пользователям баз данных(БД) и разработчикам
трактовать конкретные данные как информацию, то есть
как сведения, содержащие не только данные, но и
описание связей между ними.
7. Модели данных (ANSI)
7Описание логической
структуры данных
БАЗА
ДАННЫХ
8.
Моделирование:• Инфологическое (семантическое)
Модель «сущность-связь» (метод ER-диаграмм):
- выделяют объекты (сущности),
8
- формируют список основных свойств (атрибутов),
описывающую каждую область рассматриваемой
сущности.
• Документальное
- дискрипторные модели;
- тезаурусные модели;
- форматные модели.
• Фактографическое
(относятся к концептуальному
уровню, поддерживаются конкретными СУБД)
- иерархические;
- сетевые;
- реляционные.
9.
Иерархическая модель данныхЭффективна для работы с иерархически упорядоченной информацией.
Имеет структуру «дерево», может быть «лесом».
Структура записи для каждого уровня одинакова, на разных уровнях могут быть
различные структуры. Обход сверху вниз, слева направо.
Основные принципы проектирования:
9
1. Каждый «потомок» имеет только одного «предка»;
2. «Предок» может иметь несколько «потомков».
Основными СУБД являются
IMS, PC/Focus, Team-Up, Data Edge,
Ока, ИНЭС, МИРИС.
10.
Сетевая модель данныхЯвляется обобщенным вариантов иерархической модели.
Структура - произвольный граф.
Два вида описателей: описание записи (группы записей) и описание связей двух типов
(для записей «предка» и «потомка»).
Основные принципы проектирования:
10
1.
2.
Каждый «потомок» может иметь несколько «предков»;
«Предок» может иметь несколько «потомков».
Основными СУБД являются
IDMS, db_Vistal, СЕТЬ, СЕТОР, КОМПАС.
11.
Реляционная модель данных1970-1971 гг. Эдгар Кодд ввел понятие реляции (relation - отношение) и
реляционные языки обработки данных.
Структура – двумерные таблицы.
11
Кортеж – Строка (сведения об одном экземпляре объекта).
Атрибут – Столбец (представляет свойство объекта).
Атрибут, идентифицирующий кортеж, называется ключом.
Домен – набор атрибутов одного столбца.
Степень реляции – число атрибутов в реляции.
Основными СУБД являются:
MS Access, MS FoxPro, PARADOX, MySQL и др.
Среди более мощных (типа «клиент-сервер»)
широкое распространение получили Oracle,
MS SQL Server, Informix.
12.
Структуры и виды связей реляционной модели данных12
Основные информационные объекты – двумерные таблицы (отношения или
реляции).
Между ними устанавливаются связи (бинарные ассоциации).
Процесс трансформации данных в реляционную форму – нормализация –
удаление избыточных данных из каждой таблицы.
Главная цель нормализации – получение такого проекта базы данных, в
котором каждый факт появляется лишь в одном месте.
13.
Пять форм (стадий) нормализации1. Первая нормальная форма (1НФ) –
• каждое поле таблицы должно быть неделимым и
• не должно содержать повторяющихся групп.
13
2. Вторая нормальная форма (2НФ) –
• Требования 1НФ,
• Все не ключевые поля полностью зависят от первичного ключа.
3. Третья нормальная форма (3НФ) –
• Требования 2НФ,
• Все не ключевые поля не зависят друг от друга.
14.
Пять форм (стадий) нормализацииУсиленная третья форма (НФБК) –
• Требования 3НФ,
• Отсутствуют зависимости ключей от не ключевых атрибутов.
4. Четвёртая нормальная форма (4НФ) –
14
• Запрещает хранить независимые элементы в одной и той же
таблице, когда между этими элементами существует связь типа
«многие-ко-многим».
5. Пятая нормальная форма (5НФ) –
• Имеется возможность перестраивать данные в нормализованных
таблицах, в которые они были переведены(сохранение всех
элементов в базе в процессе нормализации).
15.
Пример нормализации (до 3-ей формы)Отношения:
15
НомЗачКн
ФИО
Группа
Специальность
Квалификация
16.
Пример нормализации (до 3-ей формы):1НФ
16
1. ФИО →
• Фамилия
• Имя
• Отчество
Отношения:
Отношения:
НомЗачКн
ФИО
Группа
Специальность
Квалификация
1НФ
НомЗачКн
Фамилия
Имя
Отчество
Группа
Специальность
Квалификация
17.
Пример нормализации (до 3-ей формы):2НФ
2. Первичный ключ :
• НомЗачКн
17
Отношения:
Отношения:
НомЗачКн
Фамилия
Имя
Отчество
Группа
Специальность
Квалификация
2НФ
НомЗачКн
Фамилия
Имя
Отчество
Группа
Специальность
Квалификация
18.
Пример нормализации (до 3-ей формы):3НФ
3. Атрибуты Специальность и Квалификация полностью зависят от
атрибута Группа, который не является ключевым. Разделим данное
отношение на два:
18
• СТУДЕНТЫ - НомЗачКн (ключ), Группа, Фамилия, Имя, Отчество
• ГРУППЫ - Группа (ключ), Специальность, Квалификация
Отношения:
НомЗачКн
Фамилия
Имя
Отчество
Группа
Специальность
Квалификация
СТУДЕНТЫ :
3НФ
ГРУППЫ:
Группа
Специальность
Квалификация
НомЗачКн
Группа
Фамилия
Имя
Отчество
19.
Операции реляционной алгебрыНад эквивалентными отношениями!
1. Объединение
19
2. Пересечение
3. Разность
20.
ПРИМЕР20
21.
Операции реляционной алгебры4. Расширенное декартово произведение отношения R1 степени N (3)
и отношения R2 степени M (2) называется отношение R3 степени
N+M (5), которое содержит кортежи, полученные сцеплением
кортежей R1 и R2.
21
22.
Операции реляционной алгебры5. Горизонтальный выбор
(операция фильтрации)
22
6. Вертикальный выбор
(операция
проектирования)
7. Операция условного
соединения
8. Операция деления
23.
Модели данных физического уровняПредназначены для управления файловыми и бесфайловыми структурами
данным на уровне физических устройств.
1. Файловая структура
Файл - это линейная последовательность записей, расположенных на внешнем
носителе.
23
Файлы последовательного доступа имеют переменную длину записи.
Файлы прямого доступа имеют переменную длину записи.
Файлы индексной структуры – дополнение к файлам с собственно данными и
содержат списки номеров записей таблицы в порядке сортировки по
заданному полю (по ключу).
• Плотный индекс
• Неплотный индекс
• В-деревья
24.
Модели данных физического уровня2. Бесфайловая структура
Защита данных от злоумышленников и конкурентов.
Данные в виде страниц данных:
• заголовок страницы;
24
• данные;
• слоты с информацией об адресе, длине страницы и т.д.
Данные объединены в экстенты (от 4-х страниц, 2 Гбайта).