Similar presentations:
Машинное обучение. День 2. Классификация
1.
Машинноеобучение
День 2. Классификация.
2.
2ПЛАН
День 2. Классификация.
01
ОСНОВЫ
10 МИН
Методы классификации: линейные методы,
решающие деревья.
03
ПЛАН РЕШЕНИЯ
ML-ЗАДАЧ 5 МИН
Решим 1 задачу по плану методами пакета
python -- sklearn.
Формальная постановка задачи ML. Основные
понятия и проблемы.
МЕТОДЫ
15 МИН
02
Как организован процесс решения ML-задачи. В
первом приближении.
ПРАКТИКА
10 МИН
04
3.
013
ОСНОВЫ
10 МИН
Постановка задачи и признаки
X – множество объектов / features
Y – целевое значение / target
f – решающая функция или алгоритм ML
X=
f(X)=Y
Типы признаков:
F2
F3
14.3
4
F4
F5
class
type1 127
2.8
1
13.35 5
type2 100
2.65
12
1
type1 101
2.8
3
17.1
4
type1 113
3.85
2
Y=
2
Кодирование категориальных признаков:
LabelEncoding
OneHotEncoding
количественные
категориальные
F1
Sex
male
female
F1
F2
Sex
0
1
male
1
0
female
F1
0
1
4.
014
ОСНОВЫ
10 МИН
Выборки и метрики
Этапы:
обучение (train)
Метрика
• Метрика – это число.
• Это показатель того, насколько хорошо работает наш алгоритм и какая у него
обобщающая способность.
• Метрика считается только на тестовой выборке
тестирование (test)
Accuracy
Метрика доли верно угаданных ответов (accuracy).
Разделение данных:
обучение (train) – 80%
тестирование (test) – 20%
Y_true
Y_pred
1
1
1
0
0
0
σ