Similar presentations:
Понятие данных в информационных системах
1. Организация и проектирование баз данных
Курс лекцийдля слушателей переподготовки специальности
1 40 01 73 «Программное обеспечение
информационных систем»
2. Понятие данных в информационных системах
3. Информационные системы
Информационная система - это совокупность программныхи аппаратных средств для хранения, обработки,
транспортировки и представления информации
Признаком ИС является
- большие объемы хранимой информации
- простые алгоритмы обработки информации
- не критичность времени получения информации
- большое количество источников и получателей информации
4. Типы информационные системы
OLTP (Online Transaction Processing, оперативная обработка транзакций)БД называются БД оперативной обработки.
OLAP (On - Line Analitical Processing - оперативная аналитическая обработка
данных) и Data Mining (раскопка данных).
БД называются хранилищами.
Основное назначение OLTP:
Основное назначение OLAP и Data Mining:
формирование первичных
согласованных данных
как можно быстрее выдавать данные для
построения аналитических отчетов (OLAP) и
поиск скрытых закономерностей в данных и
решение задач прогнозирования (Data
Mining).
Основная характеристика
OLTP:
выполнение большого
количества коротких транзакций
на изменение данных в
реальном времени.
Основная характеристика OLAP и Data
Mining:
- выполнение небольшого количества
сложных транзакций на выборку данных.
5. Типы информационные системы
6. Виды информационные системы
Системы с распределеннойобработкой (DDP,
Distributed Data Processing)
Основной признак DDP централизованная база данных
Системы распределенных баз
данных (DDB, Distributed Data Base)
Основной признак DDB –
распределенная база данных
Computer
Computer
Computer
Database
Computer
Database
Database
Computer
Computer
Database
Основное достоинство DDP –
высокая согласованность данных
Основное достоинство DDB –
масштабируемость и устойчивость
7. Работа с базой данных
База данных – именованная совокупность данных, отражающаясостояние объектов и их отношений предметной области.
Файл с данными
файл
по служащим
Файл Файл
с данными
учета раб.времени
Система управления файлами
операционной системы
База данных
Программа обновления данных
по служащим
Программа создания отчетов
по служащим
Программа начисления
зарплаты по служащим
8. Предпосылки появления СУБД
struct{ CString
s_name;
int
i_Status;
int
i_Valus …
Программа обновления данных
по служащим
}
Система управления файлами
операционной системы
ОСД
Файл с данными
1. по
При
изменении модели данных требовалось изменить
служащим
программы всех пользователей.
Программа создания отчетов по
служащим
ОСД прав доступа к
2. Невозможность обеспечения разграничения
данным разных пользователей.
Файл с данными
учета раб.времени
Программа начисления
зарплаты по служащим
ОСД
3. Параллельная работа нескольких пользователей
с одним и тем
же файлом значительно затрудняла логику программирования и
приводила к снижению производительности системы.
9. СУБД
СУБД – совокупность языковых и программных средств,предназначенных для управления совместным
использованием базы данных многими пользователями
ОСД
Файл с данными
по служащим
ОСД
Файл с данными
учета раб.времени
Система управления файлами
операционной системы
База данных
Программа обновления данных
по служащим
Запрос на обновление данных
СУБД
Программа создания отчетов
по служащим
Запрос на получение данных
Программа начисления
зарплаты по служащим
Запрос на получение данных
Запрос на получение данных
10. Основные функции СУБД
1. Определение данных2. Обработка данных
3. Управление данными
Описание структур данных
Добавление, изменение и
удаление данных, сортировка и
поиск.
Определение пользователей и их
прав доступа к различным
данным, блокировки доступа к
данным, управление данными на
внешних устройствах, …
11. Архитектура БД
ANSI (American National Standards Institute) предложенаорганизации БД в виде 3-х уровней абстракций описания данных
Внешний уровень
Логическая независимость
Концептуальный уровень
Физическая независимость
Физический уровень
Описание данных для решения
задач конечных пользователей
Описание данных в виде
обобщенной логической
структуры
Описание данных в
файловой системе
Логическая независимость – возможность изменения одного приложения без
корректировки другого
Физическая независимость – перенос хранения информации с одного носителя
на другой при сохранении работоспособности всех приложений
Каждый уровень архитектуры БД представляется моделью данных
12. Модели данных
13. Объект БД - информация
Термин «информация» происходит от латинского слова«informatio» - разъяснение, изложение, сведения.
Информация отличается от понятия «данные» и «сообщение».
5032111011620425
50321
Код группы
11
день
01
16
месяц
2
год
04
период
25
кол. предметов
Информация извлекается из данных и зависит от объекта
воспринимающего (обрабатывающего) это сообщение.
Результат зависит от свойств этого объекта.
В зависимости от целей и интересов из одного и того же
сообщения можно извлечь совершенно разную информацию.
кол.слуш.
14. Иерархия информации
Информация в ИС имеет много уровней абстрагированияУровень пользователя
Computer
Документ, форма, график
…
приложение
Уровень программы
Типы данных Int, Struct …
СУФ ОС
Уровень лог.носителя
Файл, FAT, FNTS …
Драйвер
Уровень физ.носителя
Диск, цилиндр, дорожка, сектор
15. Модель данных
Модель – это абстракция, с помощью которой человек описывает сутьпроблемы или явления без акцента на существенных деталях, с целью
понимания и возможности исследования проблемы или явления.
Модель данных – это набор концепций, содержащих сведения об
организации данных, их отношениях (взаимосвязях), ограничениях и
допустимых операциях.
Данные
5032111011620425
Модель
данных
1. Код группы(5 цифр)
2. день (2 цифры)
3. месяц (2 цифры)
4. год (2 цифры)
5. период (1 цифра)
6. кол.предметов (2 цифры)
7. кол.слуш. (2 цифры)
16. Модель данных
Каждый уровень архитектуры БД представляется моделью данныхМодели внешнего уровня являются подсхемами даталогических
моделей или структурами данных, используемых в системах
программирования (объектно-ориентированная модель)
Даталогическая модель определяет тип конкретной СУБД
Модели концептуального уровня называют даталогическими. Они
представляет собой отображение логических связей между элементами
данных безотносительно к их содержанию и среде хранения. В них
отражены особенности предметной области, для которой создаётся БД.
Модели физического уровня называются физическими моделями данных и
определяют способы размещения и доступа данных в файлах.
17. Классификация концептуальных моделей данных
Даталогические моделиописывают информацию в виде жесткой структуры
Модели, ориентированные на формат документа
основаны
на языках
разметки
документов
(SGML Тезаурусные
модели
содержат
определенные
Standart
Generalised
Markup
Language,
HTML языковые
конструкции
и принципы
их
Дескрипторные
модели
основаны
на
HyperText
MarkupвLanguage,
язык разметки
взаимодействия
заданной грамматике.
Они
дескрипторах—
описателях,
имеющих
жесткую
гипертекста
и
XML
eXtensible
Markup
Language),
Графовые
модели
данных
отражают
совокупность
эффективно
используютсядокументы
в системах-в
структуру
и описывающих
которые
позволяют
организовывать
информацию,
объектов
реального
мира
в
виде графа
переводчиках.
Множественные
модели
основаны
на теории
соответствии
с
теми
характеристиками,
которые
содержащуюся
в
документах,
и
представлять
ее в
взаимосвязанных
информационных
объектов.
множеств
и
описывают
совокупность
объектов
требуются
для
работы
с
ними.
Информация
Модели
бинарных
ассоциаций
используются
в
некотором
стандартном
виде.
реального
мира
в
виде
отношений.
обрабатывается
исключительно
по дескрипторам,
а
системах
искусственного
интеллекта.
К этим
не по самому
текстумодели,
документа.
моделям
относятся
например, Data
Semantics (автор Абриал) и DIAM II (автор Сенко).
Графовые
Множественные
Объектноориентированные
Объектно реляционные
Тезауросные
Бинарных
ассоциаций
Дискрипторные
Иерархические
Формат
документа
Фактографические
Реляционные
Документальные
Сетевые
Описывают слабоструктурированную информацию
18. Модель данных основа СУБД
Документальные модели –определяют семейство
документно-ориентированных
БД.
Реляционная модель данных –
определяет семейство
реляционных СУБД
Объектно-ориентированные
модели данных – определяют
семейство объектноориентированных СУБД
Реляционные СУБД составляют
значительную часть рынка (порядка
80% от всего рынка).
Значительная часть рынка
реляционных СУБД принадлежит
Oracle, DB2, MS SQL Server, SyBase,
MySQL (более 90%).
Lotus Notes ( IBM)/ Notes/Domino;
CouchDB, MongoDB
DB2; Informix; Oracle; Teradata
Database; Microsoft SQL Server;
SyBase; Microsoft Access;
PostgreSQL; MySQL; FoxPro …
Db4o; ObjectStore; Caché
19. Ещё одна классификация базы данных
БДМножество разнородных систем
Реляционные БД
NoSQL
Ключ-значение
SQL
Реляционная модель
Schema less
Graph
Colunm
Exadata
Exadata
Sybase
DB2
SQL Server
Oracle
Neo4j
MongoDB
CouchDB
HBase
Cassandra
Dinamo
Document
20. Характеристика NoSQL БД
1. Не используется SQL2. Неструктурированные
(schemaless)
3. Представление данных в виде
агрегатов (aggregates).
4. Слабые ACID свойства.
5. Применяются в распределенных
системах, без совместно
используемых ресурсов (share
nothing).
21. Иерархическая модель
Модель описывает структуру данных в виде направленного графаА
потомок
предок
потомок
B
D
предок
потомок
C
E
Модель данных для БД
автомобильной компании
Корневой
сегмент
Модель
F
сегменты
Двигатель
Сегмент – это набор
однородных записей
Записи состоят из полей
Поле – это минимальная неделимая
структура данных, доступная
пользователю как единое целое
…
Кузов
…
…
Лев.дв.
…
Подвеска
…
Прав.дв. … Лев.крыло
…
…
22. Иерархическая модель
Экземпляры сегмента АЭкземпляры сегмента C
Адрес корневого сегмента
Ссылки на потомков
Сегмент A
Сегмент B
Поле 1 Поле 2 Поле 3
Поле 1 Поле 2
Поле 1 Поле 2 Поле 3
Поле 1 Поле 2
Поле 1 Поле 2 Поле 3
Поле 1 Поле 2
Поле 1 Поле 2
Поле 1 Поле 2
Сегмент С
Поле 1 Поле 2 Поле 3
Сегмент D
Сегмент F
Поле 1 Поле 2
Поле 1 Поле 2 Поле 3
Поле 1 Поле 2 Поле 3
Поле 1 Поле 2
Поле 1 Поле 2 Поле 3
Поле 1 Поле 2
Сегмент E
23. Иерархическая модель
Описание данных иерархической модели включаетописание сегментов и полей для каждого сегмента
SEGM NAME = <имя сегмента>
BYTES = <размер сегмента в байтах>
FREQ = <среднее количество экземпляров>
PARENT = <имя корневого сегмента>
FIELD NAME = (<имя поля>[,SEQ],{U|M})
START = <размер поля в байтах>
TYPE = {X|P|C}
FIELD NAME = …
24. Иерархическая модель
Недостатки иерархической модели1. Невозможность простой реализации
связей, основанных на потомке,
имеющем несколько предков
2. Сложность реализации связей М:М,
основанных на потомке, имеющем
несколько предков
А
B
С
А
потомок
B
С
предок
предок
потомок
25. Сетевая модель
Модель описывает структуру данных в виде наборовдвухуровневых графов
Набором называется
двухуровневый граф,
связывающий отношением «одинко-многим» два типа записей
Между двумя типами записей
может быть определено любое
количество наборов
А
Владелец набора
B
Член набора
Товары
Клиенты
Заказы
26. Сетевая модель
Область данных типа«Товары»
Область данных типа
«Клиент»
ФИО
Адрес
ФИО
Адрес
Наим. Цена
Область данных типа
«Заказы»
Номер Кол-во о
о
Номер Кол-во о
о
Номер Кол-во о
о
Номер Кол-во о
о
Наим. Цена
Наим. Цена
27. Недостатки графовых моделей
1. Жесткая структура, требующая распределенияпамяти между структурными элементами этих моделей
2. Запросы к БД реализовывались как навигационные
программы.