4.62M
Category: educationeducation

Обучение без учителя

1.

Обучение без учителя

2.

План занятия
1. Способы машинного обучения
2. Обучение без учителя
3. Понижение размерности
4. Метод главных компонент и t-SNE
5. Кластеризация
6. Метод K-средних
7. Иерархическая кластеризация
8. DBSCAN
9. Метрики качества кластеризации
10.Проклятие размерности
2

3.

Способы машинного обучения
3

4.

Способы машинного обучения
4

5.

Способы машинного обучения
5

6.

Обучение без учителя
Обучение без учителя – способ машинного обучения, восстанавливающий
внутренние взаимосвязи в исходных неразмеченных данных
Типы входных данных:
• признаковое описание объектов
• матрица расстояний между объектами
Типы задач:
• кластеризация
• понижение размерности
• визуализация данных
• поиск правил ассоциации
• заполнение пропущенных значений
6

7.

Понижение размерности
Понижение размерности – отображение из видимого пространства
высокой размерности в латентное пространство меньшей размерности
Алгоритмы:
• метод главных компонент (PCA)
• t-SNE
• UMAP
• …
Также можно использовать
архитектуру «автокодировщик».
7

8.

t-SNE
8

9.

Stochastic Neighbor Embedding
9

10.

Дивергенция Кульбака-Лейблера
10

11.

t-SNE
11

12.

Визуализация с помощью понижения размерности
12

13.

Кластеризация
Кластеризация – группировка множества объектов на подмножества (кластеры)
таким образом, чтобы объекты из одного кластера были более похожи друг на
друга, чем на объекты из других кластеров по какому-либо критерию
13

14.

Кластеризация
14

15.

Кластеризация
Алгоритмы кластеризации:
• метод К-средних
• DBSCAN
• иерархическая кластеризация
• …
15

16.

Метод К-средних
16

17.

Метод К-средних
17

18.

Иерархическая кластеризация
18

19.

Иерархическая кластеризация
19

20.

Расстояния в иерархической кластеризации
20

21.

DBSCAN
21

22.

DBSCAN
22

23.

DBSCAN
23

24.

DBSCAN
24

25.

25

26.

Метрики качества кластеризации
Внутренние:
• среднее внутрикластерное расстояние
• среднее межкластерное расстояние
• коэффициент силуэта
Внешние:
• гомогенность
• Полнота
• V-мера (аналог F-меры для гомогенности и полноты)
• Adjusted Rand Index
• Adjusted Mutual Information
• и остальные метрики из многоклассовой классификации
26

27.

Проклятие размерности
27
English     Русский Rules