Similar presentations:
Первая встреча
1. Первая встреча
Ильина Виктория,тимлид, Яндекс.Практикум
2.
План встречи• Общие моменты
• Ответы на наиболее
часто встречаемые
вопросы
• Нюансы проекта
• Live вопросы-ответы
Яндекс.Практикум
3. Организационные моменты
Организационные моменты
Яндекс.Практикум
4.
м предстоит построить прототип модели машинного обучения. Его разработка состоит из нескольких этапов:оставьте план работы. Исходное условие задачи заведомо неполное и содержит лишнюю информацию. Проведите исследовательский анализ данных, чтобы понять, какие вопросы подготовить.
точните задачу. Задайте вопросы тимлиду.
азработайте модель. Отдайте код на проверку ревьюверу.
одготовьте отчёт. Отправьте отчёт тимлиду, чтобы он проверил успешность выполнения задания.
Вам предстоит построить прототип модели машинного обучения. Его
разработка состоит из нескольких этапов:
1.Составьте план работы. Исходное условие задачи заведомо неполное
и содержит лишнюю информацию. Проведите исследовательский
анализ данных, чтобы понять, какие вопросы подготовить.
2.Уточните задачу. Задайте вопросы тимлиду.
3.Разработайте модель. Отдайте код на проверку ревьюверу.
4.Подготовьте отчёт. Отправьте отчёт тимлиду, чтобы он проверил
успешность выполнения задания.
Яндекс.Практикум
5.
Дедлайны:28 июля — рекомендованный дедлайн отправки плана работы
1 августа — рекомендованный дедлайн отправки кода
5 августа— рекомендованный дедлайн отправки отчета
6 августа — дедлайн отправки дополнительной задачи в eduflow
7 августа— дедлайн проверки дополнительной задачи в eduflow
Жёсткий дедлайн финального проекта — 7 августа (включительно).
Яндекс.Практикум
6. Частые вопросы
Яндекс.Практикум7.
Что нужно предсказывать?
Какие признаки можно использовать?
Какую метрику нужно использовать?
Яндекс.Практикум
8.
Критерии оценки:AUC-ROC < 0.75 — 0 sp
0.75 ≤ AUC-ROC < 0.81 — 4 sp
0.81 ≤ AUC-ROC < 0.85 — 4.5 sp
0.85 ≤ AUC-ROC < 0.87 — 5 sp
0.87 ≤ AUC-ROC < 0.88 — 5.5 sp
AUC-ROC ≥ 0.88 — 6 sp
Яндекс.Практикум
9.
В некоторых файлах есть не все клиенты, что это значит?
В данных есть пропуски, что делать?
Про некоторые данные непонятно, как их использовать
(непонятно, как превратить в признаки)
Яндекс.Практикум
10.
Описание полей данных:BeginDate – дата начала пользования услугами,
EndDate – дата окончания пользования услугами,
Type – тип договора: ежемесячный, годовой и т.д,
PaperlessBilling – факт выставления счёта на электронную почту,
PaymentMethod – способ оплаты,
MonthlyCharges – ежемесячные траты на услуги,
TotalCharges – всего потрачено денег на услуги,
Dependents – наличие иждивенцев,
Senior Citizen – наличие пенсионного статуса по возрасту,
Partner – наличие супруга(и),
MultipleLines – наличие возможности ведения параллельных линий во время
Яндекс.Практикум
звонка.
11. Нюансы
Яндекс.Практикум12.
Объединение таблиц;
Мультиколлинеарность;
Правило Романа Беляева
(random_state = 250722);
Яндекс.Практикум
Кросс-валидация.
13.
Критерии проверки отчёта:Полное ли решение?
Есть сравнение итогового решения с планом?
Описаны затруднения и решения?
Описаны ключевые шаги решения?
Предложена итоговая модель?
Понятно, какие признаки построены?
Понятно, как предобрабатываются данные?
Яндекс.Практикум