Уровни архитектуры по обращению с большими данными
Угрозы и риски использования больших данных
Этапы процесса анализа данных по стандарту CRISP-DM
Этапы процесса анализа данных по методологии SEMMA
Этапы процесса анализа данных по методологии KDD
Использование различных методологий в анализе данных
Типы задач анализа данных
1.80M

Введение_бальшие_данные

1.

Технологии обработки
информации
Лекция Введение в большие данные. Понятие
машинное обучение
доцент кафедры информатики Глотова М.И.
1

2.

DATA-DRIVEN
• Data
Driven (дословно — «управляемый
данными») — это подход к управлению,
основанный на данных. Его главный постулат:
решения нужно принимать, опираясь на
анализ цифр, а не интуицию и личный опыт.
https://www.uplab.ru/blog/data-driven/
2

3.

Большие данные
• Большие данные (Big Data, англ.) представляют собой новое
качество обычных данных в электронном виде, накопленных в
большом объёме в разнообразных информационных системах,
(корпоративных, государственных), сайтах, блогах;
• Согласно исследованиям IDC, мировой рынок бизнесаналитики и больших данных планомерно растет: в 2015 г.
он достиг $122 млрд., в 2016 г. – уже $130 млрд. К 2020 г.
аналитики прогнозируют рост объема рынка до $203 млрд;
• Количество накопленных данных для российского рынка в
2020 году составит 980 экзабайт.
3

4.

V-модель Больших
данных
Variety
Velocity
Volume
Value
Veracity
Validity
4

5. Уровни архитектуры по обращению с большими данными

5

6. Угрозы и риски использования больших данных

6

7. Этапы процесса анализа данных по стандарту CRISP-DM

7

8. Этапы процесса анализа данных по методологии SEMMA

8

9. Этапы процесса анализа данных по методологии KDD

9

10. Использование различных методологий в анализе данных

10

11. Типы задач анализа данных

Поиск частых
шаблонов/ассоц
иативных
правил
Визуализация
Кластеризация
Предикт
Классификация
11
English     Русский Rules