Similar presentations:
Витрина данных
1.
Витрина данныхМожаев А.П.
Сергиенко Г.А.
2.
ВИТРИНА ДАННЫХВитрина данных (Data Mart) — подмножество хранилища
данных, представляющее собой массив тематической,
узконаправленной информации, ориентированной, например,
на пользователей одной рабочей группы или подразделения.
Также есть две другие трактовки:
Специализированное хранилище
информации, в котором содержатся
сведения по одному из векторов
деятельности компании.
Комплекс тематически связанных
БД (баз данных), относящихся к
конкретным направлениям работы
организации.
3.
Различия между витриной данных, озером данных ихранилищем данных
Хранилище данных — это
система управления
данными, которая
поддерживает анализ
бизнес-данных и
выполнение аналитики для
всей организации.
Озеро данных позволяет
организациям хранить большие
объемы структурированных и
неструктурированных данных
(например, из социальных сетей
или данных о посещениях) и
мгновенно предоставлять к ним
доступ.
Основное различие между
озером данных и хранилищем
данных состоит в том, что в
озере хранятся большие
объемы необработанных
данных без заранее
определенной структуры.
Источниками для витрины данных могут служить внутренние операционные
системы, центральное хранилище данных и внешние данные.
4.
КОНЦЕПЦИЯ ХРАНИЛИЩАForrester Research выделяли следующие сильные
стороны своего проекта – витрин данных:
Представление
аналитикам только той
информации, которая
действительно нужна
Максимальная
приближенность целевой
части хранилища данных
к конкретному
пользователю.
Содержание
тематических
подмножеств заранее
агрегированных
специалистами данных
Не требуется
вычислительная техника
большой мощности.
Но в то же время Forrester
Research говорили и о слабых
сторонах своего изобретения:
Реализация
информационной
территориально
распределенной
системы
Не
предполагается
методик,
способов,
которые могли
бы обеспечить
целостность и
непротиворечив
ость
хранящейся в
витрине данных
(базе данных
узкоспециально
й) информации.
Концепция была предложена Forrester
Research в 1991 году, по мысли авторов,
витрины — множество тематических баз
данных, содержащих информацию,
относящуюся к отдельным аспектам
деятельности организации.
5.
КОНСТРУИРОВАНИЕ ВИТРИНГлавный пример витрин данных –
это тематические подмножества
заранее агрегированной
информации.
Соответственно, такие БД гораздо
легче проектировать и
настраивать. Создают подобные
витрины для поиска конкретных
ответов на запросы пользователя.
Данные в них адаптируются
создателем под определенные
группы сотрудников. Подобная
оптимизация облегчает процедуру
наполнения витрин, способствует
повышению производительности
подобных БД.
6.
ПРИМЕРЫ НЕЗАВИСИМЫХ ВИТРИНВитрина данных подразделения
маркетинга. Включает в себя информацию
о продуктах компании, ее клиентах,
планах по продажам и проч.
Витрина данных отделения продаж.
ВД финансового отдела.
ВД подразделения оценки рисков и
прочее.
7.
ДОСТОИНСТВА И НЕДОСТАТКИ НЕЗАВИСИМЫХ ВИТРИНЗначительно меньше
“весят”, нежели базы
данных.
Сложный контроль
целостности,
избыточности,
непротиворечивости
данных.
Создание витрин –
технологически
легкий процесс.
Достаточно быстрое
внедрение витрин
данных.
С витриной работать
непросто, если для
нее используется
несколько
источников данных.
Создание для ответов
на конкретный ряд
вопросов.
Объединение
информации,
накопленной в
разных витринах, не
предусматриваются.
Данные
оптимизированы
Не дает возможности
представления
полной картины о
состоянии
деятельности
организации.
8.
Смешанная концепцияВ 1994 году Марк Демарест предложил синхронизировать концепции хранилищ
данных и витрин, задав хранилищу данных роль единого интегрированного
источника, а витрины ограничив только его срезами, тем самым снизив
остроту проблемы расхождения данных; этот подход со временем стал
стандартным.
Данное решение объединяет в себе три уровня:
Общекорпоративная база
данных
База данных (БД)
конкретного отдела,
подразделения организации
Рабочие места конечных
сотрудниковпользователей
9.
ДОСТОИНСТВА И НЕДОСТАТКИ ТРЕХМЕРНЫХ ВИТРИНУпрощенное создание подобных
витрин данных.
ВД синхронизированы и
совместимы с корпоративной БД.
Сравнительно легкое расширение
хранилища.
Гарантия хорошей
производительности системы.
Избыточность
информации.
Нужна согласованность с
архитектурой ряда
областей с потенциально
разными требованиями.
10.
Спасибо завнимание!