15.33M

тема 1

1.

CRISP-DM в 2025 году:
современный облик
жизненного цикла Data
Mining
Эволюция CRISP-DM с учётом AI, облака и автоматизации в современных проектах.
Выполнил: студент 4 курса группы ИСИТ-З-У-22/1 заочной формы обучения Мкртычян Арсен Артурович
(направление: 09.03.02–
«Информационные
системы и технологии»)

2.

Истоки и развитие CRISP-DM: от 1996-го
к современности
CRISP-DM создан в 1996 году для
стандартизации Data Mining. С тех пор
методология эволюционировала, отражая
технологические и бизнес-преобразования
до 2025 года.
2

3.

Классические этапы CRISP-DM:
основные функции
Бизнес-понимание
Понимание данных
Подготовка данных
Моделирование
Оценка и внедрение
Определение целей проекта,
выявление ключевых бизнесзадач и критериев успеха для
дальнейшей работы с данными.
Сбор, анализ и оценка качества
данных для выявления
существенных характеристик и
проблем в исходной
информации.
Очистка, трансформация и
организация данных для
создания базовой среды
моделирования.
Применение алгоритмов и
построение моделей для
обнаружения закономерностей
и прогнозирования.
Анализ результатов моделей,
проверка их качества и
интеграция решений в бизнеспроцессы.
3

4.

Современные тренды Data Mining, формирующие CRISPDM
Взрывной рост объёмов
информации
Развитие искусственного
интеллекта и ML
Увеличение разнообразия
данных
Объёмы структурированных и
неструктурированных данных
стремительно нарастают, требуя
адаптации аналитических
процессов и повышения
масштабируемости Data Mining.
Внедрение современных методов
машинного обучения
обуславливает обновление этапов
подготовки, оценки и внедрения
моделей в CRISP-DM.
Появление новых типов данных —
текст, изображения, сенсорная
информация — стимулирует
интеграцию специализированных
инструментов и методов анализа.
4

5.

Драйверы изменений в Data Mining к 2025 году
Ужесточение
нормативных требований
и политики
конфиденциальности
формируют строгие
стандарты работы с
персональными данными
и их защиту.
Технологический прогресс
ускоряет внедрение AI,
облачных инфраструктур
и автоматизации, требуя
гибкости и
масштабируемости
процессов.
Появление Explainable AI
создает новые
обязательства по
прозрачности моделей и
их интерпретируемости
для бизнеса и
регуляторов.
Внедрение эталонных
процессов управления
жизненным циклом
проектов повышает
качество и эффективность
решений Data Mining.
5

6.

Отличия традиционного CRISP-DM и
версии 2025 года
Сравнение ключевых параметров методологий,
отражающих изменения в инструментах и подходах
управления жизненным циклом Data Mining.
Новая версия CRISP-DM более эффективна для
динамичных и гибких проектов с высокими
требованиями к качеству и скорости.
Аналитика индустриальных отчётов 2025
6

7.

Бизнес-понимание в 2025 году: ROI и
цифровая стратегия
Усиленный акцент на KPI и бизнес-ценности
позволяет точно связать задачи Data Mining с
целями компании и измерить их экономический
эффект.
Интеграция цифровых стратегий обеспечивает
согласованность аналитических инициатив с
общей IT-инфраструктурой и бизнес-процессами.
Визуализация результатов через дашборды
способствует оперативной оценке вклада
проектов и принятию решений на основе данных.
7

8.

Технологии ускорения понимания и профилирования
данных
AutoML для анализа данных
Data Lineage и метаданные
Автоматическое выявление
аномалий и кластеризация
Автоматизация выбора моделей и
параметров значительно сокращает
время анализа, снижая роль
человеческого фактора и повышая
качество начальных выводов.
Отслеживание истории данных и
автоматическое создание
метаданных улучшают прозрачность
и управление жизненным циклом
информации.
Современные алгоритмы позволяют
своевременно обнаруживать
отклонения и группировать
источники данных для ускоренного
глубокого анализа.
8

9.

Обновлённый жизненный цикл Data Mining
2025
Источник: Современные методологии и индустриальные стандарты
9

10.

Автоматизация подготовки данных: ключевые
инструменты
DataOps-платформы обеспечивают сквозную
оркестрацию процессов подготовки, интегрируя
различные этапы в едином pipeline.
Автоматическая генерация препроцессинга
ускоряет подготовку данных, снижая время от
сбора до моделирования.
Искусственный интеллект систематизирует
очистку и обогащение данных, повышая качество
исходных наборов для аналитики.
Механизмы верификации данных автоматически
проверяют корректность и полноту, минимизируя
ошибки на ранних этапах.
10

11.

Динамика внедрения автоматизации в Data
Mining
Автоматизация охватывает этапы подготовки
данных, отбора признаков и мониторинга моделей,
значительно снижая время и ошибки в проектах.
Рост автоматизации подтверждает переход к
более эффективным и масштабируемым
процессам Data Mining.
Gartner, отчёт по Data Mining, 2025
11

12.

Cloud-first подходы: интеграция CRISP-DM и
облачных платформ
Массовое внедрение облаков
Облачные платформы AWS, Microsoft Azure и Google Cloud стали стандартом для
построения Data Mining проектов в 2025 году. Контейнеризация и микросервисы
обеспечивают быстрое развертывание и совместную работу.
Гибкость и масштабируемость для команд
Поддержка Multicloud решений позволяет объединять ресурсы и оптимизировать
затраты. Гибкая коллаборация между командами разных регионов стала
ключевым преимуществом облачных CRISP-DM процессов.
12

13.

Распределение поддерживаемых моделей
данных в 2025 году
Рост графовых и неструктурированных данных
связан с развитием социальных сетей и IoT,
требующих новых подходов к Data Mining.
Увеличение доли графовых данных отражает
растущую сложность анализируемых взаимосвязей
и необходимость специальных методов.
IBM Data Science Report, 2025
13

14.

Explainable AI: внедрение в CRISP-DM и
требования бизнеса
XAI инструменты обязательны
для обеспечения прозрачности
моделей и доверия
пользователей при
автоматизированном принятии
решений в бизнесе.
Визуализация процессов
принятия решений помогает
выявлять ошибки и снижать
риски, повышая качество и
интерпретируемость моделей.
Интеграция Explainability на
этапах оценки и внедрения
гарантирует соответствие
нормативам и этическим
стандартам в Data Mining
проектах.
14

15.

Мониторинг моделей и MLOps: новые стандарты
эффективности
Интеграция CI/CD и MLOps как фундамент
для стабильности
Автоматический дрифт-менеджмент
повышает надежность
Современные решения Kubeflow и MLflow
обеспечивают непрерывное развертывание и
обновление моделей. Это позволяет командам
быстро реагировать на изменения данных и
сохранять качества моделей.
Системы мониторинга выявляют отклонения в
данных и поведении модели. Это даёт возможность
своевременно корректировать модели без ручного
вмешательства, минимизируя негативное влияние
на бизнес.
15

16.

Ключевые технологические
инструменты CRISP-DM 2025
Сравнение популярных решений по AutoML, DataOps,
MLOps и XAI с акцентом на возможности и
интеграцию.
Выбор инструментов зависит от задач: AutoML ускоряет
создание, DataOps управляет процессами, MLOps
поддерживает эксплуатацию, XAI – объяснимость.
Обзор индустрии, 2025
16

17.

Этические и
юридические
аспекты при
внедрении CRISPDM 2025
Соблюдение GDPR требует тщательной верификации
и защиты персональных данных на всех этапах
жизненного цикла проектов Data Mining.
Принципы Fairness интегрируются в алгоритмы, чтобы
избежать дискриминации и обеспечить справедливое
использование ИИ в бизнес-решениях.
Обязательное предоставление прозрачности и права
на апелляцию повышают доверие клиентов и
соответствие правовым нормам.
17

18.

Реальные кейсы реорганизации процессов Data
Mining
Облачное преобразование банковской
аналитики
Автоматизация AutoML в e-commerce
Крупный банк внедрил облачные Data Mining
платформы, что позволило ускорить анализ транзакций
и повысить точность моделей выявления
мошенничества. Сроки релиза сократились на 45%.
Интернет-магазин применил AutoML и DataOps,
автоматизировав процессы подготовки и обучения
моделей для персонализации предложений.
Эффективность кампаний выросла, а время запуска
новых моделей уменьшилось на 30%.
18

19.

Перспективы развития CRISP-DM до 2030
года
2025–2026
Рост применения синтетических
данных для обучения моделей с
целью улучшения качества при
ограниченных реальных данных.
2027–2028
Широкая интеграция self-learning
систем, позволяющих моделям
самостоятельно адаптироваться к
динамичным бизнес-условиям.
2029
Полная автоматизация жизненного
цикла Data Mining с минимальным
участием человека, ускоряющая
внедрение инноваций.
2030 и далее
Развитие персонализации и
интеграция квантовых вычислений
для решения сверхсложных задач
анализа данных.
19

20.

CRISP-DM 2025:
интеграция
инноваций и
новые вызовы
Методология CRISP-DM стала стандартом
для современных проектов, обеспечивая
гибкость, автоматизацию, прозрачность и
этическую ответственность в Data Mining
процессах.
English     Русский Rules