Similar presentations:
Введение в теорию баз данных. Принципы и технологии распределённых информационных систем
1. Введение в теорию баз данных. Принципы и технологии распределённых информационных систем
ВВЕДЕНИЕ В ТЕОРИЮ БАЗДАННЫХ. ПРИНЦИПЫ И
ТЕХНОЛОГИИ РАСПРЕДЕЛЁННЫХ
ИНФОРМАЦИОННЫХ СИСТЕМ
Раздел 2. Методы проектирования и программирования ПО
2. Сегодня мы:
◦Узнаем:◦Что такое базы данных;
◦Основные принципы работы с базами
данных;
◦Модели данных;
◦Принципы и технологии распределённых
информационных систем.
3. Введение в теорию баз данных
ВВЕДЕНИЕ ВТЕОРИЮ БАЗ
ДАННЫХ
Введение в теорию баз данных. Принципы и технологии распределённых
информационных систем
4. Базы данных
База данных (БД) — этоорганизованная
совокупность данных,
предназначенная для
долговременного
хранения, быстрого
поиска, обновления и
управления информацией.
5. Как всё начиналось?
код программыпрограмма
программа
сегмент данных
описание данных
данные
а)
б)
данные
в)
БД
6. Так для чего это нужно?
1.Обеспечить целостность данных — данные должныбыть достоверны и логически непротиворечивы.
2.Исключить избыточность — избежать ненужного
дублирования.
3.Оптимизировать запросы — чтобы извлечение
информации происходило быстро и эффективно.
4.Упростить взаимодействие пользователя с
данными.
5.Обеспечить безопасность и управление доступом.
7. Это всё? Нет
Это всё? НетБаза данных – это модель информационной
системы.
Что такое информационная система?
Информационная система – система, реализующая
автоматизированный сбор, обработку и
манипулирование данными и включающая
технические средства обработки данных,
программное обеспечение и соответствующий
персонал.
8. Надо немножко разобраться
Для того, чтобы работать с данными в базах данныхтребуется понимать структуру. Все данные должны
быть структурированы.
Структурирование данных – это введение
соглашений о способах представления
данных.
9. Что легче обработать?
◦ Личное дело № 16493. Сергеев Петр Михайлович,дата рождения 1 января 1976 г.
◦ Л/д № 16593, Петрова Анна Владимировна, дата
рожд. 15 марта 1975 г.
◦ № личн. дела 16693, д.р. 14.04.76, Анохин Андрей
Борисович.
10. Что легче обработать?
№_личного_делаФамилия
Имя
Отчество
Дата_рождения
16493
Сергеев
Петр
Михайлович
16593
Петрова
Анна
Владимировна 15.03.1975
16693
Анохин
Андрей Борисович
01.01.1976
14.04.1976
11. Как с этим работать?
В современной технологии баз данныхпредполагается, что создание базы данных, ее
поддержка и обеспечение доступа
пользователей к ней осуществляются
централизованно с помощью специального
программного инструментария – системы
управления базами данных (СУБД).
12. Очень важно знать
Для формализованного определения базыданных необходимо учесть два основных
фактора ее создания:
1)цель (информационное обеспечение
интересов пользователей);
2)способ хранения (каким-то образом
упорядоченные машиночитаемые данные в
памяти компьютера).
13. Типы информационных систем
• локальные ИСБД и СУБД находятся на одном компьютере.
• файл-серверные
БД находится на сервере сети (файловом
сервере), а СУБД на компьютере
пользователя.
• клиент-серверные
БД и основная СУБД находятся на сервере,
СУБД на рабочей станции посылает запрос
и выводит на экран результат.
14. Локальные ИС
БДСУБД
• автономность (независимость)
• с БД работает только один человек
• сложно обновлять при большом количестве
пользователей
• практически невозможно «стыковать» изменения,
вносимые несколькими пользователями
15. Файл-серверные ИС
СУБДСУБД
СУБД
СУБД
• несколько человек работают с одной базой
• основную работу выполняют рабочие станции (РС), они должны
быть мощными
• для поиска строки на РС копируется вся БД – нагрузка на сеть
• слабая защита от взлома (только на РС)
• проблемы при одновременном изменении с разных РС
16. Клиент-серверные ИС
БДзапрос
на SQL
СУБД-клиент
ответ
СУБД-клиент
основную работу выполняет сервер
проще модернизация (только сервер)
по сети идут только нужные данные
защита на сервере (сложнее взломать)
разделение доступа (очередь заданий)
сложность настройки
высокая стоимость ПО (тысячи $)
17. Модели данных
Набор принципов, определяющих организациюлогической структуры хранения данных в базе,
получил название модели данных.
18. Модели данных
Модели БД определяются тремя компонентами:•допустимой организацией данных;
•ограничениями целостности;
•множеством допустимых операций.
19. Модели данных
Существуют разные модели:•Иерархическая
• Сетевая
•Реляционная (самая распространённая)
• Объектно-ориентированная
• Документная, графовая
20. Иерархическая модель
Иерархическая модель —данные организованы в виде
древовидной структуры, где
каждая запись имеет одну
родительскую и множество
дочерних.
21. Иерархическая модель
Терминологической основойдля иерархической модели
являются понятия:
• атрибут,
• запись
• и групповое отношение.
22. Иерархическая модель
Атрибут (элемент данных) –наименьшая единица
структуры данных.
Запись – именованная
совокупность атрибутов.
Групповое отношение –
иерархическое отношение
между записями двух типов.
23. Сетевая модель
Сетевая модель —данные представлены в
виде графа с
множеством связей
«многие ко многим»
между записями.
24. Реляционная модель
Реляционная модель —данные хранятся в
таблицах, где строки —
это записи, а столбцы —
поля, и используются
ключи для установления
связей между
таблицами.
25. Реляционная модель
Отношение – этодвумерная таблица,
содержащая строки,
называемые также
кортежем, и столбцы,
называемые
атрибутами, данных.
26. Реляционная модель
Кортежи – это строкитаблицы (отношения),
состоящие из
множества атрибутов,
описывающие
конкретный объект
реального мира.
27. Реляционная модель
Атрибуты – это столбцытаблицы, имеющие
определенный тип
данных, и
характеризующие
определенные признаки
и свойства объекта.
28. Реляционная модель
Понятие домен включаетдопустимое
потенциальное
множество значений
данного типа, т.е. это
множество значений,
которые может принимать
конкретный атрибут
29. Реляционная модель
30. Реляционная модель
Поле (атрибут) или комбинацию полей, значениякоторых однозначно идентифицируют каждую
запись таблицы, называют ключом.
• Если ключ состоит из одного атрибута, то он
называется простым,
• в том случае, если ключ состоит из двух и более
атрибутов, то он называется составным.
31. Реляционная модель
32. Реляционная модель
Если таблица имеет более одного возможногоключа, тогда один ключ выделяют в качестве
первичного.
Первичный ключ любой таблицы обязан содержать
уникальные непустые значения для каждой строки.
Поле, указывающее на запись в другой таблице,
связанную с данной записью, называется внешним
ключом или вторичным.
Подобное взаимоотношение между таблицами
называется связью.
33. Реляционная модель
Студент№_зачетнойКнижки
ФИО
Группа
Специальность
пол
дата_рождения
дом_адрес
семейное_положение
Студент
ФИО
дата_рождения
№_зачетнойКнижки
Группа
Специальность
пол
дом_адрес
семейное_положение
№_зачетнойКнижки –
первичный простой ключ;
ФИО+дата_рождения –
первичный составной ключ;
ФИО+дата_рождения –
альтернативный ключ
№_зачетнойКнижки –
альтернативный ключ
34. Реляционная модель
Группа связанных таблиц называется схемой базыданных.
Информация о таблицах, их полях, первичных и
внешних ключах, а также иных объектах БД,
называется метаданными
35. Объектно-ориентированная модель
Объектноориентированная модель— данные представлены в
виде объектов,
сочетающих свойства
(данные) и методы
(функции), как в объектноориентированном
программировании.
36. Документная модель
Документная модель— данные хранятся в
виде документов
(например, JSON или
XML), каждый из
которых содержит
структуру и значения.
37. Графовая модель
Графовая модель —данные представлены
узлами и связями
(рёбрами) между ними, что
удобно для представления
сложных взаимосвязей, как
в соцсетях или
рекомендательных
системах.
38. Принципы и технологии распределённых информационных систем.
ПРИНЦИПЫ И ТЕХНОЛОГИИРАСПРЕДЕЛЁННЫХ
ИНФОРМАЦИОННЫХ СИСТЕМ.
Введение в теорию баз данных. Принципы и технологии распределённых
информационных систем
39. С чего всё началось
40. А этим всё продолжилось
41. Словарь Рогожникова для прогера
Распределенная обработка данных –обработка данных, выполняемая на
независимых, но связанных между собой
компьютерах, представляющих
распределенную систему.
42. Что ещё можно распределить? Базы данных, конечно же!
Распределенная базаданных – это
совокупность
логически
взаимосвязанных баз
данных,
распределенных в
компьютерной сети.
43. Больше ничего нельзя распределить? Нет, ещё информационные системы!
Распределенные информационные системы(РИС) – это комплекс программных и
аппаратных средств, которые позволяют
организовывать совместный доступ к данным и
ресурсам, размещенным на различных
компьютерах и серверах через сети.
44. Особенности применения и построения РИС
1.Распределенность.2.Клиент-серверная архитектура.
3.Распределённая БД
4.Коммуникация
5.Масштабируемость
6.Отказоустойчивость
7.Безопасность
8.Управление ресурсами
9.Согласованность данных
10.Мониторинг и управление
45. Какие есть системы?
46. Основные компоненты РИС
•Клиенты — пользовательские интерфейсы(например, браузер или приложение).
•Серверы приложений — обрабатывают
бизнес-логику (например, проверка баланса,
создание заказа).
•Базы данных — хранят информацию
(например, данные клиентов или заказы).
•Сеть — связывает все компоненты
47. Плюсики
◦Повышает надёжность системы;◦Повышает производительность системы;
◦Повышает безопасность данных.
48. Минусы
◦Сложность проектирования и поддержки;◦Трудности в организации безопасности
данных;
◦Требуется соблюдать согласованность
данных;
◦Сетевые задержки.
49. ДОМАШНЕЕ ЗАДАНИЕ
50. Что сделать дома?
◦Выучить определения из лекции;◦Записать 3-5 ситуаций, в которых вы
сталкиваетесь с базами данных – в телефоне,
в магазинах, в транспорте и т.д. Укажите
◦ Какие данные по вашему мнению хранит эта БД?
◦ Может ли эта база данных быть распределённой?
Почему?
database