Similar presentations:
Как машинное обучение меняет подход к познанию
1. Как машинное обучение меняет подход к познанию?
Новые задачи дляквантово-статистической
теории анализа данных
Павловский Евгений Николаевич,
к.ф.-м.н.
Лаборатория аналитики
потоковых данных и
машинного обучения НГУ
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
1
2. План выступления
1.2.
3.
4.
О машинном обучении в науках
Классы задач машинного обучения
Современные методы машинного обучения
Новые задачи для совместного исследования
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
2
3. План выступления
1.2.
3.
4.
О машинном обучении в науках
Классы задач машинного обучения
Современные методы машинного обучения
Новые задачи для совместного исследования
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
3
4. Определения
• Машинное обучение – метод создания программы безнепосредственного кодирования программы, а
посредством обучения на примерах
• Проведение функции через заданные точки в сложно
устроенных пространствах (К.В. Воронцов)
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
4
5. Машинное обучение как наука
• около 100 000 научных публикаций в год• тысячи алгоритмов
• наиболее успешное направление искусственного
интеллекта, вытеснившее экспертные системы и
инженерию знаний
• более инженерия, нежели наука
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
5
6. Примеры машинного обучения в физике
• Машинное обучение и квантовый отжиг нашли распадыбозона Хиггса, https://nplus1.ru/news/2017/10/19/higgslearning, 19.10.2017
• ФВЭ: Learning Particle Physics by Example: Location-Aware
Generative Adversarial Networks for Physics Synthesis,
https://arxiv.org/abs/1701.05927, 13.06.2017
• Астро: Generative Adversarial Networks recover features in
astrophysical images of galaxies beyond the deconvolution
limit, https://arxiv.org/abs/1702.00403, 1.02.2017
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
6
7. Надежды на ИИ и МО
Лаборатория аналитики потоковых данных имашинного обучения НГУ (С)
7
8. План выступления
1.2.
3.
4.
О машинном обучении в науках
Классы задач машинного обучения
Современные методы машинного обучения
Новые задачи для совместного исследования
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
8
9. Классы задач машинного обучения
КластеризацияКлассификация
Регрессия
Цензурирование
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
Снижение
размерности
9
10. Классификация
F1F2
F3
…
FM
Class
X1
1,1
Red
01.11.17
…
A
C1
X2
2,32
Red
07.11.17
…
B
C2
…
…
…
…
…
…
…
XN
4,56
Blac
k
27.11.17
…
AAB
?
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
10
11. Измерительные шкалы
• Номинальные (categorical): только равенство.Green ≠ Blue
• bool, list
• Порядковые: сравнение.
«BCC» > «BCB» (lexicographic)
• char
• Интервальные: порядковые + расстояние.
• date
• Отношений: интервальные + ноль
• …
30 C больше 15 C как
-5 C больше -20 C
лекция в 2 раза дольше чем вчерашняя
вес 70кг в 1.4 раза больше чем 50кг
• Абсолютная: отношений + сложение
N, Q, R
• double, int
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
11
12. Методология DIKW
Данные– зафиксированные факты (данность)
Информация – уменьшает неопределённость
(всегда есть источник и приёмник)
Знания
– дают предсказуемый результат
(рецепты)
Мудрость
– понимание условий использования
(«знания» в платоновском смысле)
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
12
13. План выступления
1.2.
3.
4.
О машинном обучении в науках
Классы задач машинного обучения
Современные методы машинного обучения
Новые задачи для совместного исследования
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
13
14. Снижение размерности
PCA, t-SNE, AEЛаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
14
15. Метод главных компонент (PCA)
Лаборатория аналитики потоковых данных имашинного обучения НГУ (С)
15
16. t-SNE
60
2
5
3
4
8
9
7
1
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
16
17.
1.2.
3.
4.
Маленький корпус
1000 документов (EHR) Кардиохирургия
Обработан конвейером
Word2vec 200 dims
Проекция T-SNE для визуализации
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
17
18. t-SNE
Кластер беременности, здесь кромеоднокоренных отнесены "неделя" и
аббревиатура "нед"
Кластер гипертонии: семантически
близки все возможные "гипер
*тонии *тензии" и "риск". Термин
"эссенциальный" вызвал вопросы,
но оказалось есть "эссенциальная
гипертония" (95 % всех случаев).
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
18
19. t-SNE
Кластер протезирования.Из интересного тут:
"Тромбэктомия" - операция по
удалению тромботических масс из
ранее установленного протеза.
"Карбоникс" - марка протезов.
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
19
20. t-SNE в астрофизике
The Galah Survey: Classification and diagnostics with t-SNE reduction of spectral informationhttps://arxiv.org/pdf/1612.02242.pdf, 09.12.2016
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
20
21. t-SNE – материалы курса МФТИ
• https://www.coursera.org/learn/unsupervisedlearning/lecture/Bn22S/mietod-t-sneЛаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
21
22. Автоэнкодер (Сверточный)
Лаборатория аналитики потоковых данных имашинного обучения НГУ (С)
22
23. Восстановление поверхности
1 - череп без повреждения;2 - череп со смоделированным
повреждением;
3 - имплантат для
поврежденной модели;
4 - восстановленная модель
черепа.
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
23
24. Глубокие нейронные сети
CNN, RNN, LTSM, GAN, ...Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
24
25. CNN
Лаборатория аналитики потоковых данных имашинного обучения НГУ (С)
25
26. CNN – извлечение признаков
Лаборатория аналитики потоковых данных имашинного обучения НГУ (С)
26
27. CNN
Classifying Complex Faraday Spectra with Convolutional Neural Networkshttps://arxiv.org/abs/1711.03252, 9.11.2017
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
27
28. CNN для поиска гравитационных линз
Deep Convolutional Neural Networks as strong gravitational lens detectorshttps://arxiv.org/pdf/1705.07132.pdf, 19.05.2017
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
28
29. GAN (Архитектура) Генеративная состязательная сеть
Случайныйшум
Реальный/
Ложный
Генеративная
модель
Состязательная
модель
Ложное
изображение
Реальное
изображение
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
29
30. GAN (pix2pix)
Лаборатория аналитики потоковых данных имашинного обучения НГУ (С)
30
31. Local Awareness GAN
Learning Particle Physics by Example: Location-Aware Generative Adversarial Networks for Physics Synthesishttps://arxiv.org/pdf/1701.05927.pdf, 13.06.2017
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
31
32.
Distributed RepresentationСлово представляется вектором в многомерном пространстве
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
32
33.
Distributed RepresentationЛаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
33
34. План выступления
1.2.
3.
4.
О машинном обучении в науках
Классы задач машинного обучения
Современные методы машинного обучения
Новые задачи для совместного исследования
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
34
35. Новые задачи для квантово-статистической теории анализа данных
Лаборатория аналитики потоковых данных имашинного обучения НГУ (С)
35
36. Смешанные состояния
• Задача:• Учесть влияние наблюдателя и прибора на измерения
• Метод: при измерении восстановить исходную матрицу плотности
макросистемы «измеряемое-прибор-наблюдатель»
• Зачем?
• реализовать запутанные системы и смешанные состояния
• использовать матрицу плотности вместо исходных данных
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
36
37. Нецифровые шкалы
• Множество подмножеств: X \subset N• Какими алгоритмами работать с такими измерениями?
• Инвариантность относительно выбранной шкалы
• Проследить все операции с этим типом данных
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
37
38. Источники
• https://nplus1.ru/news/2017/10/19/higgs-learning• Машинное обучение и квантовый отжиг нашли распады бозона Хиггса
• https://arxiv.org/abs/1701.05927
• Learning Particle Physics by Example: Location-Aware Generative Adversarial
Networks for Physics Synthesis
• https://arxiv.org/abs/1711.03252, 9.11.2017
• Classifying Complex Faraday Spectra with Convolutional Neural Networks
• http://www.nsu.ru/xmlui/bitstream/handle/nsu/13448/08.pdf
• Павловский Е. Н., Пакулич Д. В., Поспелов С. О. Восстановление 3Dмодели дефекта черепа на основе глубоких нейронных сетей // Вестн.
НГУ. Серия: Информационные технологии. 2017. Т. 15, № 3. С. 74–78. DOI
10.25205/1818-7900-2017-15-3-74-78. ISSN 1818-7900.
• https://arxiv.org/pdf/1705.07132.pdf, 19.05.2017
• Deep Convolutional Neural Networks as strong gravitational lens detectors
Лаборатория аналитики потоковых данных и
машинного обучения НГУ (С)
38
39. Контакты
к.ф.-м.н.Павловский Евгений Николаевич
зав. лабораторией аналитики
потоковых данных и машинного
обучения НГУ
+79139117907
[email protected]