Similar presentations:
Введение в Data Science
1.
Введениев Data
Science
Цель курса
Программа
Финальный проект
2.
Цель курсаПомочь сделать
первый шаг в
Data Science
3.
С чего мы начинали95%
99%
учениц не имели опыта в Data Science,
в том числе и в других сопряженных
областях: программирование,
статистика, аналитика и др.
учениц не работали в
областях, связанных с
аналитикой.
У нас было 3 месяца, чтобы обучить участниц
знаниям и навыкам, необходимым для
реализации первых собственных проектов
4.
Программа01
Язык программирования Python
(basic Python syntax, pandas, numpy)
02
Визуализация данных
(matplotlib, seaborn)
03
Основные статистические индикаторы
(mean, median, mode, std…)
04
Разведочный
анализ данных
05
Машинное обучение
(scikit-learn)
06
Финальный
проект
5.
Финальный проектЦель:
Формат:
Области:
Источники
данных:
применение
полученных знаний на
практике и погружение
в среду, аналогичную
реальному рабочему
процессу
совместная работа в
группах по 2-3 человека
телекоммуникация,
банкинг, недвижимость,
авиалинии, управление
персоналом
данные, находящиеся в
открытом доступе
(Kaggle.com, github.com).
Зачастую предоставляются
компаниями в рамках
соревнований
6.
Что нужно знать доначала выступлений?
Структура выступлений
01
Введение в
проблему
02
Знакомство с
данными
03
Демонстрация результатов
разведочного анализа
o Углубление в проблему
o Анализ причин, связей,
закономерностей
o Заключительные выводы
04
Модели машинного
обучения
o Цели построения модели
o Подготовка данных
o Построение моделей
o Оценка производительности моделей
05
Выводы и
рекомендации
7.
Что нужно знать доначала выступлений?
Вы можете столкнуться с незнакомой терминологией
Accuracy, Recall, Precision, confusion matrix
R2, RMSE
Линейная регрессия
Логистическая регрессия
Дерево решений
Оценивайте процесс, а не результат
модели машинного обучения
Вы не видите от 50 до 80%
результатов труда
8.
Спасибо завнимание
Введение в
Data Science
Цель курса
Программа
Финальный проект