Similar presentations:
Анализ данных с применением методов машинного обучения
1.
Анализ данных с применениемметодов машинного обучения
Выполнен учениками второго
математического направления Летней
проектной школы Роснефти - 2025
2.
Мотивация и акт уальностьАнализ данных становится всё более востребованным в различных
сферах бизнеса. Компании активно используют машинное обучение
для повышения эффективности, прогнозирования рисков и
оптимизации процессов. Владение такими технологиями открывает
широкие карьерные и исследовательские возможности.
Актуальность темы подтверждается быстрым ростом числа вакансий,
связанных с Data Science.
3.
Цель и задачи проекта1
2
Цель
Задачи
Применить методы машинного обучения для анализа
Предварительная обработка данных.
данных и построения моделей, способных делать
Исследовательский анализ.
Построение и оценка качества моделей.
Определение влияния переменных.
Сравнение алгоритмов.
предсказания.
4.
Теоретическая база и инструменты анал изаДля выполнения проекта мы опираемся на
базовые и продвинутые методы машинного
обучения. Основной язык
программирования — Python, а также
библиотеки pandas, NumPy, matplotlib и
seaborn.
Мы используем pandas для загрузки,
очистки и обработки таблиц с данными, а
NumPy — для работы с массивами и
выполнения числовых операций.
5.
Предсказание числовыхзначений
В рамках проекта мы будем решать задачу предсказания числового
значения, например, цены или количества топлива на АЗС. Для этого
мы планируем использовать различные методы проверки и обучения.
Мы сравним, насколько точно каждая модель делает предсказания, и
выберем ту, которая показывает наилучший результат. Это поможет
понять, какой подход лучше всего справляется с нашей задачей.
6.
Сравнение моделей и анализ признаковСравнение качества
Анализ влияния признаков
Интерпретируемость
После построения моделей мы
Мы будем анализировать, какие
Мы уделим внимание как метрикам,
сравним их по качеству и выберем
признаки оказали наибольшее
так и интерпретируемости моделей
наиболее эффективную для каждой
влияние на результат, чтобы лучше
для обоснования полученных
задачи.
понять поведение моделей.
выводов.
7.
Ожидаемы е результаты ив ы воды
В ходе проекта мы ожидаем построить рабочие модели, способные
делать обоснованные прогнозы. Мы планируем получить
представление о том, как применять машинное обучение к реальным
данным и какие методы дают наилучший результат.
Наш проект поможет нам развить навыки анализа, визуализации и
построения моделей, что поможет компании Роснефть
оптимизировать свои затраты.
informatics