Similar presentations:
тема 1
1.
CRISP-DM в 2025 году:современный облик
жизненного цикла Data
Mining
Эволюция CRISP-DM с учётом AI, облака и автоматизации в современных проектах.
Выполнил: студент 4 курса группы ИСИТ-З-У-22/1 заочной формы обучения Мкртычян Арсен Артурович
(направление: 09.03.02–
«Информационные
системы и технологии»)
2.
Истоки и развитие CRISP-DM: от 1996-гок современности
CRISP-DM создан в 1996 году для
стандартизации Data Mining. С тех пор
методология эволюционировала, отражая
технологические и бизнес-преобразования
до 2025 года.
2
3.
Классические этапы CRISP-DM:основные функции
Бизнес-понимание
Понимание данных
Подготовка данных
Моделирование
Оценка и внедрение
Определение целей проекта,
выявление ключевых бизнесзадач и критериев успеха для
дальнейшей работы с данными.
Сбор, анализ и оценка качества
данных для выявления
существенных характеристик и
проблем в исходной
информации.
Очистка, трансформация и
организация данных для
создания базовой среды
моделирования.
Применение алгоритмов и
построение моделей для
обнаружения закономерностей
и прогнозирования.
Анализ результатов моделей,
проверка их качества и
интеграция решений в бизнеспроцессы.
3
4.
Современные тренды Data Mining, формирующие CRISPDMВзрывной рост объёмов
информации
Развитие искусственного
интеллекта и ML
Увеличение разнообразия
данных
Объёмы структурированных и
неструктурированных данных
стремительно нарастают, требуя
адаптации аналитических
процессов и повышения
масштабируемости Data Mining.
Внедрение современных методов
машинного обучения
обуславливает обновление этапов
подготовки, оценки и внедрения
моделей в CRISP-DM.
Появление новых типов данных —
текст, изображения, сенсорная
информация — стимулирует
интеграцию специализированных
инструментов и методов анализа.
4
5.
Драйверы изменений в Data Mining к 2025 годуУжесточение
нормативных требований
и политики
конфиденциальности
формируют строгие
стандарты работы с
персональными данными
и их защиту.
Технологический прогресс
ускоряет внедрение AI,
облачных инфраструктур
и автоматизации, требуя
гибкости и
масштабируемости
процессов.
Появление Explainable AI
создает новые
обязательства по
прозрачности моделей и
их интерпретируемости
для бизнеса и
регуляторов.
Внедрение эталонных
процессов управления
жизненным циклом
проектов повышает
качество и эффективность
решений Data Mining.
5
6.
Отличия традиционного CRISP-DM иверсии 2025 года
Сравнение ключевых параметров методологий,
отражающих изменения в инструментах и подходах
управления жизненным циклом Data Mining.
Новая версия CRISP-DM более эффективна для
динамичных и гибких проектов с высокими
требованиями к качеству и скорости.
Аналитика индустриальных отчётов 2025
6
7.
Бизнес-понимание в 2025 году: ROI ицифровая стратегия
Усиленный акцент на KPI и бизнес-ценности
позволяет точно связать задачи Data Mining с
целями компании и измерить их экономический
эффект.
Интеграция цифровых стратегий обеспечивает
согласованность аналитических инициатив с
общей IT-инфраструктурой и бизнес-процессами.
Визуализация результатов через дашборды
способствует оперативной оценке вклада
проектов и принятию решений на основе данных.
7
8.
Технологии ускорения понимания и профилированияданных
AutoML для анализа данных
Data Lineage и метаданные
Автоматическое выявление
аномалий и кластеризация
Автоматизация выбора моделей и
параметров значительно сокращает
время анализа, снижая роль
человеческого фактора и повышая
качество начальных выводов.
Отслеживание истории данных и
автоматическое создание
метаданных улучшают прозрачность
и управление жизненным циклом
информации.
Современные алгоритмы позволяют
своевременно обнаруживать
отклонения и группировать
источники данных для ускоренного
глубокого анализа.
8
9.
Обновлённый жизненный цикл Data Mining2025
Источник: Современные методологии и индустриальные стандарты
9
10.
Автоматизация подготовки данных: ключевыеинструменты
DataOps-платформы обеспечивают сквозную
оркестрацию процессов подготовки, интегрируя
различные этапы в едином pipeline.
Автоматическая генерация препроцессинга
ускоряет подготовку данных, снижая время от
сбора до моделирования.
Искусственный интеллект систематизирует
очистку и обогащение данных, повышая качество
исходных наборов для аналитики.
Механизмы верификации данных автоматически
проверяют корректность и полноту, минимизируя
ошибки на ранних этапах.
10
11.
Динамика внедрения автоматизации в DataMining
Автоматизация охватывает этапы подготовки
данных, отбора признаков и мониторинга моделей,
значительно снижая время и ошибки в проектах.
Рост автоматизации подтверждает переход к
более эффективным и масштабируемым
процессам Data Mining.
Gartner, отчёт по Data Mining, 2025
11
12.
Cloud-first подходы: интеграция CRISP-DM иоблачных платформ
Массовое внедрение облаков
Облачные платформы AWS, Microsoft Azure и Google Cloud стали стандартом для
построения Data Mining проектов в 2025 году. Контейнеризация и микросервисы
обеспечивают быстрое развертывание и совместную работу.
Гибкость и масштабируемость для команд
Поддержка Multicloud решений позволяет объединять ресурсы и оптимизировать
затраты. Гибкая коллаборация между командами разных регионов стала
ключевым преимуществом облачных CRISP-DM процессов.
12
13.
Распределение поддерживаемых моделейданных в 2025 году
Рост графовых и неструктурированных данных
связан с развитием социальных сетей и IoT,
требующих новых подходов к Data Mining.
Увеличение доли графовых данных отражает
растущую сложность анализируемых взаимосвязей
и необходимость специальных методов.
IBM Data Science Report, 2025
13
14.
Explainable AI: внедрение в CRISP-DM итребования бизнеса
XAI инструменты обязательны
для обеспечения прозрачности
моделей и доверия
пользователей при
автоматизированном принятии
решений в бизнесе.
Визуализация процессов
принятия решений помогает
выявлять ошибки и снижать
риски, повышая качество и
интерпретируемость моделей.
Интеграция Explainability на
этапах оценки и внедрения
гарантирует соответствие
нормативам и этическим
стандартам в Data Mining
проектах.
14
15.
Мониторинг моделей и MLOps: новые стандартыэффективности
Интеграция CI/CD и MLOps как фундамент
для стабильности
Автоматический дрифт-менеджмент
повышает надежность
Современные решения Kubeflow и MLflow
обеспечивают непрерывное развертывание и
обновление моделей. Это позволяет командам
быстро реагировать на изменения данных и
сохранять качества моделей.
Системы мониторинга выявляют отклонения в
данных и поведении модели. Это даёт возможность
своевременно корректировать модели без ручного
вмешательства, минимизируя негативное влияние
на бизнес.
15
16.
Ключевые технологическиеинструменты CRISP-DM 2025
Сравнение популярных решений по AutoML, DataOps,
MLOps и XAI с акцентом на возможности и
интеграцию.
Выбор инструментов зависит от задач: AutoML ускоряет
создание, DataOps управляет процессами, MLOps
поддерживает эксплуатацию, XAI – объяснимость.
Обзор индустрии, 2025
16
17.
Этические июридические
аспекты при
внедрении CRISPDM 2025
Соблюдение GDPR требует тщательной верификации
и защиты персональных данных на всех этапах
жизненного цикла проектов Data Mining.
Принципы Fairness интегрируются в алгоритмы, чтобы
избежать дискриминации и обеспечить справедливое
использование ИИ в бизнес-решениях.
Обязательное предоставление прозрачности и права
на апелляцию повышают доверие клиентов и
соответствие правовым нормам.
17
18.
Реальные кейсы реорганизации процессов DataMining
Облачное преобразование банковской
аналитики
Автоматизация AutoML в e-commerce
Крупный банк внедрил облачные Data Mining
платформы, что позволило ускорить анализ транзакций
и повысить точность моделей выявления
мошенничества. Сроки релиза сократились на 45%.
Интернет-магазин применил AutoML и DataOps,
автоматизировав процессы подготовки и обучения
моделей для персонализации предложений.
Эффективность кампаний выросла, а время запуска
новых моделей уменьшилось на 30%.
18
19.
Перспективы развития CRISP-DM до 2030года
2025–2026
Рост применения синтетических
данных для обучения моделей с
целью улучшения качества при
ограниченных реальных данных.
2027–2028
Широкая интеграция self-learning
систем, позволяющих моделям
самостоятельно адаптироваться к
динамичным бизнес-условиям.
2029
Полная автоматизация жизненного
цикла Data Mining с минимальным
участием человека, ускоряющая
внедрение инноваций.
2030 и далее
Развитие персонализации и
интеграция квантовых вычислений
для решения сверхсложных задач
анализа данных.
19
20.
CRISP-DM 2025:интеграция
инноваций и
новые вызовы
Методология CRISP-DM стала стандартом
для современных проектов, обеспечивая
гибкость, автоматизацию, прозрачность и
этическую ответственность в Data Mining
процессах.