10.79M
Category: informaticsinformatics

Анализ данных с применением методов машинного обучения

1.

Анализ данных с применением
методов машинного обучения
Выполнен учениками второго
математического направления Летней
проектной школы Роснефти - 2025

2.

Мотивация и акт уальность
Анализ данных становится всё более востребованным в различных
сферах бизнеса. Компании активно используют машинное обучение
для повышения эффективности, прогнозирования рисков и
оптимизации процессов. Владение такими технологиями открывает
широкие карьерные и исследовательские возможности.
Актуальность темы подтверждается быстрым ростом числа вакансий,
связанных с Data Science.

3.

Цель и задачи проекта
1
2
Цель
Задачи
Применить методы машинного обучения для анализа
Предварительная обработка данных.
данных и построения моделей, способных делать
Исследовательский анализ.
Построение и оценка качества моделей.
Определение влияния переменных.
Сравнение алгоритмов.
предсказания.

4.

Теоретическая база и инструменты анал иза
Для выполнения проекта мы опираемся на
базовые и продвинутые методы машинного
обучения. Основной язык
программирования — Python, а также
библиотеки pandas, NumPy, matplotlib и
seaborn.
Мы используем pandas для загрузки,
очистки и обработки таблиц с данными, а
NumPy — для работы с массивами и
выполнения числовых операций.

5.

Предсказание числовых
значений
В рамках проекта мы будем решать задачу предсказания числового
значения, например, цены или количества топлива на АЗС. Для этого
мы планируем использовать различные методы проверки и обучения.
Мы сравним, насколько точно каждая модель делает предсказания, и
выберем ту, которая показывает наилучший результат. Это поможет
понять, какой подход лучше всего справляется с нашей задачей.

6.

Сравнение моделей и анализ признаков
Сравнение качества
Анализ влияния признаков
Интерпретируемость
После построения моделей мы
Мы будем анализировать, какие
Мы уделим внимание как метрикам,
сравним их по качеству и выберем
признаки оказали наибольшее
так и интерпретируемости моделей
наиболее эффективную для каждой
влияние на результат, чтобы лучше
для обоснования полученных
задачи.
понять поведение моделей.
выводов.

7.

Ожидаемы е результаты и
в ы воды
В ходе проекта мы ожидаем построить рабочие модели, способные
делать обоснованные прогнозы. Мы планируем получить
представление о том, как применять машинное обучение к реальным
данным и какие методы дают наилучший результат.
Наш проект поможет нам развить навыки анализа, визуализации и
построения моделей, что поможет компании Роснефть
оптимизировать свои затраты.
English     Русский Rules