425.13K
Category: softwaresoftware

Варианты реализации OLAP

1.

Курс
«Хранилища данных»
Тема:
Варианты реализации OLAP
Барабанщиков Игорь Витальевич

2.

OLAP-серверы
• Для выполнения аналитической обработки
данных применяют OLAP-серверы.
• OLAP-серверы скрывают от конечного
пользователя способ реализации
многомерной модели.
• Они формируют гиперкуб, с которым
пользователи с помощью OLAP-клиента
выполняют необходимые манипуляции.
• Способ реализации OLAP важен, так как от
него зависит производительность и
занимаемые ресурсы.

3.

Варианты реализации OLAP
• ROLAP – реляционный (relational)
• MOLAP – многомерный (multivariate)
• HOLAP – гибридный (hybrid)

4.

ROLAP
• Для реализации
многомерной модели в
ROLAP используются
реляционные БД.
• Применяются
денормализованные
модели данных.
• Пример:
- Oracle 11g EE
- MS SQL Server 2012

5.

Характеристики ROLAP
Достоинства:
• Возможность работы с существующими реляционными
БД.
• Экономичное использование ресурсов.
• Большая гибкость при добавлении новых измерений.
Недостатки:
• Меньшая производительность по сравнению с MOLAP.
• Требуют тщательной проработки схемы БД и индексов.
• Требуют больше усилий от администратора БД.

6.

Модели данных для ROLAP
В настоящее время
распространены три
основные схемы
реализации
многомерного
представления данных
с помощью
реляционных таблиц:
- звезда
- снежинка
- созвездие

7.

Схема «Звезда»
Модель данных состоит
из 2-х типов таблиц:
• одной таблицы
фактов (fact table) центр «звезды»
• нескольких таблиц
измерений (dimension
table) по числу
измерений в модели
данных — лучи
«звезды».

8.

Схема «Звезда»
• Схема «Звезда» специальная организация
реляционных таблиц,
удобная для хранения
многомерных
показателей.
• Таблица фактов
содержит сведения,
которые будут
анализироваться.
• Таблицы измерений
содержат данные,
которые описывают
факты.
• Таблицы измерений
денормализованы.

9.

Схема «Снежинка»
• Получила название за
свою форму, в виде
которой отображается
логическая схема
таблиц.
• Имеет одну таблицу
фактов, соединенную с
таблицами измерений.
• Таблицы измерений
нормализованны, в
отличие от схемы
звезда.

10.

Пример схемы «Снежинка»

11.

Схема «Созвездие»
Схема
Созвездие
содержит
несколько
таблиц
фактов.
Разные факты
могут иметь
разные
измерения.

12.

Таблица Фактов
• Содержит числовые параметры (меры),
описывающие факты.
• Имеет составной ключ, состоящий из
первичных ключей таблиц измерений.
• Первичный ключ таблицы измерения
является внешним ключом в таблице фактов.
• Таблица фактов обычно имеет небольшое
количество полей (не более 20-ти).
• Числовые параметры используются для
агрегации и суммирования.

13.

Таблицы Измерений
• Содержат данные о детализации фактов.
• Содержат описательную информацию о
числовых значениях в таблице фактов, т.е.
они содержат атрибуты фактов.
• Денормализованные таблицы измерений
содержат большое количество полей.
• Имеют значительно меньше строк, чем
таблицы фактов.
• Атрибуты таблиц измерений используются
при визуализации данных в отчетах и
запросах.

14.

MOLAP
• Для реализации
многомерной модели
используются
многомерные БД.
• Данные хранятся в
виде упорядоченных
многомерных массивов.
• Примеры:
- Oracle Essbase
- Oracle Database + OLAP
Option
- MS Analysis Services

15.

MOLAP. Способы хранения данных
• MOLAP-серверы хранят данные в виде
упорядоченных многомерных массивов.
• Такие массивы подразделяются на гиперкубы и
поликубы.
• В гиперкубе все хранимые в БД ячейки имеют
одинаковую мерность (все измерения).
• В поликубе каждая ячейка хранится с собственным
набором измерений. Связанные с этим сложности
обработки перекладываются на внутренние
механизмы системы.
• Физически данные хранятся в «плоских» файлах.

16.

Характеристики MOLAP
Достоинства:
• Поиск и выборка данных осуществляется
значительно быстрее.
• Легко справляются с задачами включения в
информационную модель разных встроенных
функций.
Недостатки:
• За счет агрегации объем данных в 5-100 раз
меньше объема исходных данных.
• Чаще всего гиперкуб является сильно разряженным.
• MOLAP чувствителен к изменению многомерной
модели.

17.

HOLAP
• Для реализации многомерной модели используют
гибридную архитектуру, которая объединяет
технологии ROLAP и MOLAP.
• Серверы HOLAP применяют подход ROLAP для
разреженных областей многомерного пространства.
• Серверы HOLAP применяют подход MOLAP для
плотных областей многомерного пространства.
• Серверы HOLAP разделяют запрос на несколько
подзапросов, направляет их соответствующим
фрагментам данных, комбинирует результаты, а
затем предоставляет данные пользователю.

18.

Итоги
• Для выполнения
аналитической обработки
данных применяют OLAPсерверы.
• OLAP-серверы скрывают
от конечного пользователя
способ реализации
многомерной модели.
• Существует 3 варианта
реализации OLAP.
English     Русский Rules