Технологии бизнес-аналитики
Ирисы Фишера
Применение кластерного анализа
857.65K
Category: informaticsinformatics

Технологии бизнес-аналитики

1. Технологии бизнес-аналитики

1) Потребности бизнеса
2) Компьютеры
3) Информационные системы 4) Обнаружение знаний
ТЕХНОЛОГИИ:
Knowledge Discovery in Databases KDD– обнаружение знаний в базах
данных
Data Mining – интеллектуальный анализ данных
ТЕХНОЛОГИИ -> Программные продукты -> Прикладные аналитические
решения
ДАННЫЕ - ИНФОРМАЦИЯ - ЗНАНИЯ И РЕШЕНИЯ
ЗАДАЧИ - ДЕЙСТВИЯ И МЕТОДЫ РЕШЕНИЯ - ПРИЛОЖЕНИЯ

2.

• Knowledge Discovery in Databases KDD– обнаружение
знаний в базах данных : последовательность действий
по подготовке данных, выбору информативных
признаков, очистке, построение моделей,
интерпретации полученных результатов
• «Ядром» этого процесса является Data Mining –
интеллектуальный анализ данных

3.

• Получение данных: запросы, фильтры; эксперты помогают
отобрать признаки, влияющие на результат.
Оптимальный источник – хранилище данных.
• Очистка данных: заполнение пропусков, подавление
выбросов, сглаживание, исключение дубликатов и
противоречий…
Задача очистки может иметь самостоятельную ценность.
• Преобразование данных: скользящее окно, вычисление
агрегатов, приведение типов, выделение интервалов,
квантование, сортировка, группировка, расчет производных
столбцов…

4.

Data Mining
Считается, что термин был введен Г.Пятецким-Шапиро в 1989г.
Оригинальное определение следующее:
«Data Mining – обнаружение в «сырых» данных ранее
неизвестных, нетривиальных, практически полезных и доступных
интерпретации знаний, необходимых для принятия решений в
различных сферах человеческой деятельности».

5.

6.

Модели и задачи Data Mining

7.

Описательная аналитика (Descriptive analytics) ближе к сложной
визуализации и разведочному анализу – компактное описание множества
объектов в виде правил, кластеров, шаблонов поведения, групп.
Описательные модели пытаются ответить:
• Какова структура клиентской базы?
• Какой профиль идеального клиента?
• Какие есть взаимосвязи между характеристиками клиентов?
• Какие события происходят одновременно?
Предсказательное моделирование (Predictive analytics) отвечает на
вопросы:
• Откликнется ли клиент на данную маркетинговую кампанию?
• Какой размер прибыли будет в следующем месяце?
• Какие из потенциальных клиентов вероятно совершат приобретение
• услуги в следующем месяце?
• Какой прогнозируемый спрос на следующий период планирования?

8.

Ассоциация – выявление закономерностей между связанными событиями.
Ассоциативное правило указывает, что из события X следует событие Y.
Примеры приложения ассоциативных правил:
• выявление наборов товаров, которые часто покупаются вместе;
• определение доли клиентов, положительно относящихся к
нововведениям;
• определение профиля посетителей веб-ресурса;
• определение доли случаев, в которых новое лекарство показывает
опасный побочный эффект.

9.

Задачи Data Mining – кластеризация
Кластеризация – это группировка объектов (наблюдений, событий)
на основе свойств, описывающих сущность объектов.
Объекты внутри кластера должны быть «похожими» и отличаться
от объектов, вошедших в другие кластеры.
Интерпретация кластеров производится с использованием
профилей кластеров.
Целями кластеризации является желание оперировать не
объектами в отдельности, а подгруппами объектов.

10. Ирисы Фишера

11.

12.

Методы анализа
Дескриптивная
аналитика
Задачи аналитики
Ассоциативные правила
Что случилось?
Диагностическая
аналитика
Кластерный анализ
Почему это случилось?
Предикативная
аналитика
Классификация
Что может случиться?
Предписывающая
аналитика
Машинное обучение
Что делать?
Нейронные сети
Регрессионный анализ
Симуляция

13. Применение кластерного анализа

• В медицине используется кластеризация заболеваний, лечения
заболеваний или их симптомов, а также таксономия пациентов,
препаратов и т.д.
• В археологии устанавливаются таксономии каменных сооружений и
древних объектов и т.д.
• В маркетинге это может быть задача сегментации конкурентов и
потребителей.
• В менеджменте примером задачи кластеризации будет разбиение
персонала на различные группы, классификация потребителей и
поставщиков, выявление схожих производственных ситуаций, при
которых возникает брак.
• В социологии задача кластеризации - разбиение респондентов на
однородные группы.

14.

Data Mining – задачи классификации и регрессии
Классификация – отнесение объекта (события, наблюдения) к одному из
заранее известных классов. Примеры таких классов:
• Заемщик банка: допустит просрочку или не допустит просрочку;
• Клиент телекоммуникационной компании: уйдет в течение года или не уйдет в
течение года;
• Фильтр электронной почты: спам, не спам.
Задача регрессии – установление зависимости непрерывной выходной переменной
от входных переменных. Примеры:
• Оценка стоимости недвижимости;
• Прогнозирование объема продаж;
• Прогноз цен на оптовом рынке;
• Какие банкоматы какими суммами инкассировать.

15.

Data Mining и связь с другими областями
English     Русский Rules