Similar presentations:
Варианты реализации OLAP
1.
Курс«Хранилища данных»
Тема:
Варианты реализации OLAP
Барабанщиков Игорь Витальевич
2.
OLAP-серверы• Для выполнения аналитической обработки
данных применяют OLAP-серверы.
• OLAP-серверы скрывают от конечного
пользователя способ реализации
многомерной модели.
• Они формируют гиперкуб, с которым
пользователи с помощью OLAP-клиента
выполняют необходимые манипуляции.
• Способ реализации OLAP важен, так как от
него зависит производительность и
занимаемые ресурсы.
3.
Варианты реализации OLAP• ROLAP – реляционный (relational)
• MOLAP – многомерный (multivariate)
• HOLAP – гибридный (hybrid)
4.
ROLAP• Для реализации
многомерной модели в
ROLAP используются
реляционные БД.
• Применяются
денормализованные
модели данных.
• Пример:
- Oracle 11g EE
- MS SQL Server 2012
5.
Характеристики ROLAPДостоинства:
• Возможность работы с существующими реляционными
БД.
• Экономичное использование ресурсов.
• Большая гибкость при добавлении новых измерений.
Недостатки:
• Меньшая производительность по сравнению с MOLAP.
• Требуют тщательной проработки схемы БД и индексов.
• Требуют больше усилий от администратора БД.
6.
Модели данных для ROLAPВ настоящее время
распространены три
основные схемы
реализации
многомерного
представления данных
с помощью
реляционных таблиц:
- звезда
- снежинка
- созвездие
7.
Схема «Звезда»Модель данных состоит
из 2-х типов таблиц:
• одной таблицы
фактов (fact table) центр «звезды»
• нескольких таблиц
измерений (dimension
table) по числу
измерений в модели
данных — лучи
«звезды».
8.
Схема «Звезда»• Схема «Звезда» специальная организация
реляционных таблиц,
удобная для хранения
многомерных
показателей.
• Таблица фактов
содержит сведения,
которые будут
анализироваться.
• Таблицы измерений
содержат данные,
которые описывают
факты.
• Таблицы измерений
денормализованы.
9.
Схема «Снежинка»• Получила название за
свою форму, в виде
которой отображается
логическая схема
таблиц.
• Имеет одну таблицу
фактов, соединенную с
таблицами измерений.
• Таблицы измерений
нормализованны, в
отличие от схемы
звезда.
10.
Пример схемы «Снежинка»11.
Схема «Созвездие»Схема
Созвездие
содержит
несколько
таблиц
фактов.
Разные факты
могут иметь
разные
измерения.
12.
Таблица Фактов• Содержит числовые параметры (меры),
описывающие факты.
• Имеет составной ключ, состоящий из
первичных ключей таблиц измерений.
• Первичный ключ таблицы измерения
является внешним ключом в таблице фактов.
• Таблица фактов обычно имеет небольшое
количество полей (не более 20-ти).
• Числовые параметры используются для
агрегации и суммирования.
13.
Таблицы Измерений• Содержат данные о детализации фактов.
• Содержат описательную информацию о
числовых значениях в таблице фактов, т.е.
они содержат атрибуты фактов.
• Денормализованные таблицы измерений
содержат большое количество полей.
• Имеют значительно меньше строк, чем
таблицы фактов.
• Атрибуты таблиц измерений используются
при визуализации данных в отчетах и
запросах.
14.
MOLAP• Для реализации
многомерной модели
используются
многомерные БД.
• Данные хранятся в
виде упорядоченных
многомерных массивов.
• Примеры:
- Oracle Essbase
- Oracle Database + OLAP
Option
- MS Analysis Services
15.
MOLAP. Способы хранения данных• MOLAP-серверы хранят данные в виде
упорядоченных многомерных массивов.
• Такие массивы подразделяются на гиперкубы и
поликубы.
• В гиперкубе все хранимые в БД ячейки имеют
одинаковую мерность (все измерения).
• В поликубе каждая ячейка хранится с собственным
набором измерений. Связанные с этим сложности
обработки перекладываются на внутренние
механизмы системы.
• Физически данные хранятся в «плоских» файлах.
16.
Характеристики MOLAPДостоинства:
• Поиск и выборка данных осуществляется
значительно быстрее.
• Легко справляются с задачами включения в
информационную модель разных встроенных
функций.
Недостатки:
• За счет агрегации объем данных в 5-100 раз
меньше объема исходных данных.
• Чаще всего гиперкуб является сильно разряженным.
• MOLAP чувствителен к изменению многомерной
модели.
17.
HOLAP• Для реализации многомерной модели используют
гибридную архитектуру, которая объединяет
технологии ROLAP и MOLAP.
• Серверы HOLAP применяют подход ROLAP для
разреженных областей многомерного пространства.
• Серверы HOLAP применяют подход MOLAP для
плотных областей многомерного пространства.
• Серверы HOLAP разделяют запрос на несколько
подзапросов, направляет их соответствующим
фрагментам данных, комбинирует результаты, а
затем предоставляет данные пользователю.
18.
Итоги• Для выполнения
аналитической обработки
данных применяют OLAPсерверы.
• OLAP-серверы скрывают
от конечного пользователя
способ реализации
многомерной модели.
• Существует 3 варианта
реализации OLAP.