Similar presentations:
Инфографика и визуализация данных
1.
ИНФОГРАФИКА И ВИЗУАЛИЗАЦИЯДАННЫХ
Лекция 1: Введение
Ю.В. Пестова
2.
СОДЕРЖАНИЕ ЛЕКЦИИО КУРСЕ
ТЕМЫ
РАЗБАЛЛОВКА
1.
Посещаемость
Лабы
Доклад
Тесты
Зачет
5
45
10
35
30
1. Вводная лекция
2. Tableau
1. Основы
2. Интерактивные элементы
3. Аналитика
4. Дашборд
3. Python
1. Сбор данных
2. Pandas
3. Matplotlib
4. Интерактивность
5. Dash
4. Пространственные данные:
1. BI
2. Python
5. *Дополнительные инструменты визуализации
О визуализации
1.
Назначение
2.
Терминология и введение понятия
«Инфографика»
2.
Этапы работы
1.
Сбор данных
2.
Обработка и анализ данных
3.
Создание отчетов
4.
Проектирование
3.
Табличный тип и переменные
4.
Классификация элементов
инфографики
5.
Рекомендации и правила
визуализации
2
3.
ОПРЕДЕЛЕНИЕ• Визуализация данных – это использование
визуальных представлений для изучения,
осмысления и передачи данных.
3
4.
Визуализация данных решает триглавные задачи:
Задача визуализации
Цель
Разведка: поиск важных фактов
Обнаружение
Создание смысла
Понимание
Коммуникация: передача информации
другим
Принятие решений
https://www.perceptualedge.com/blog/?p=1897
Грамотная визуализация, которая учитывает психологию восприятия помогает решить эти задачи эффективно.
4
5.
МИФЫ О ВИЗУАЛИЗАЦИИ ДАННЫХ№1
• Визуализируем данные только потому, что есть некоторые люди, которые лучше визуально
воспринимают информацию.
• Визуализируем данные, потому что есть люди, у которых сложности с математикой и числами.
• Нет. Просто некоторые виды информации лучше всего воспринимаются визуально всеми людьми.
5
6.
МИФЫ О ВИЗУАЛИЗАЦИИ ДАННЫХ№2
• Визуализируем, чтобы привлечь внимание, но при этом жертвуем
информативностью.
• Нет, если информация не принесена в жертву красоте.
6
7.
МИФЫ О ВИЗУАЛИЗАЦИИ ДАННЫХ№2
• Визуализируем, чтобы привлечь внимание, но при этом жертвуем
информативностью.
• Нет, если информация не принесена в жертву красоте.
7
8.
МИФЫ О ВИЗУАЛИЗАЦИИ ДАННЫХ№3
• Графика - лучший способ рассказать историю.
• Необязательно. Многие истории все еще прекрасно чувствуют себя,
написанными словами. Графика может быть бэкграундом.
8
9.
ПРЕИМУЩЕСТВА ВИЗУАЛИЗАЦИИ1. Видение
общей картины
2. Быстрое и
простое сравнение
значений
3. Видеть
закономерности
9
10.
ВИДЕНИЕ ОБЩЕЙКАРТИНЫ
✗
№1
Графики отображают общую картину: обзор
набора данных. В обзоре кратко излагаются
основные характеристики данных, из которых
мы можем определить, что является обычным, а
что исключительным.
✓
10
11.
ПРОДУКТБычки
Горбуша
Кальмар
Камбала
Карась
ПРОСТОЕ И БЫСТРОЕ
СРАВНЕНИЕ
ЗНАЧЕНИЙ
№2
БЕЛКИ
12,7
21,2
18,2
16
17,5
ЖИРЫ УГЛЕВОДЫ
8,2
5,1
7,1
0
0,2
0
2,5
0
1,6
0
Карп
16
3,5
0
Кета
22,1
5,8
0
Килька
Корюшка
Крабовое
мясо
Крабовые
палочки
Красноперк
а
Креветка
14,3
15,3
9,2
3,3
0
0
ККАЛ
ТИП
147 Морепродукты
151 Морепродукты
77 Морепродукты
86 Морепродукты
84 Морепродукты
95 Морепродукты
138 Морепродукты
142 Морепродукты
93 Морепродукты
16
0,9
0
67 Морепродукты
17,9
2,1
0
73 Морепродукты
18,5
18
3,1
0,9
0
0
106 Морепродукты
85 Морепродукты
Ледяная
15,6
1,3
0
76 Морепродукты
Лещ
17,2
4,2
0
109 Морепродукты
Лосось
19,2
13,8
0
200 Морепродукты
Макрель
Мидии
отварные
Минтай
20,2
3,6
0
111 Морепродукты
9,7
15,7
1,6
0,6
0
0
53 Морепродукты
67 Морепродукты
Мойва
13,1
11,7
0
159 Морепродукты
Навага
Налим
Окунь
морской
Окунь
речной
Осетр
16,71
18,6
1,3
0,8
0
0
78 Морепродукты
85 Морепродукты
17,4
5,5
0
123 Морепродукты
18,3
16,5
0,7
10,5
0
0
80 Морепродукты
161 Морепродукты
Осьминог
18,5
0
0
74 Морепродукты
Палтус
18,5
3,2
0
106 Морепродукты
11
12.
ПРОСТОЕ И БЫСТРОЕСРАВНЕНИЕ
ЗНАЧЕНИЙ
№2
№2
ПРОДУКТ
Бычки
Горбуша
Кальмар
Камбала
Карась
БЕЛКИ
12,7
21,2
18,2
16
17,5
ЖИРЫ УГЛЕВОДЫ
8,2
5,1
7,1
0
0,2
0
2,5
0
1,6
0
Карп
16
3,5
0
Кета
22,1
5,8
0
Килька
Корюшка
Крабовое
мясо
Крабовые
палочки
Красноперк
а
Креветка
14,3
15,3
9,2
3,3
0
0
ККАЛ
ТИП
147 Морепродукты
151 Морепродукты
77 Морепродукты
86 Морепродукты
84 Морепродукты
95 Морепродукты
138 Морепродукты
142 Морепродукты
93 Морепродукты
16
0,9
0
67 Морепродукты
17,9
2,1
0
73 Морепродукты
18,5
18
3,1
0,9
0
0
106 Морепродукты
85 Морепродукты
Ледяная
15,6
1,3
0
76 Морепродукты
Лещ
17,2
4,2
0
109 Морепродукты
Лосось
19,2
13,8
0
200 Морепродукты
Макрель
Мидии
отварные
Минтай
20,2
3,6
0
111 Морепродукты
9,7
15,7
1,6
0,6
0
0
53 Морепродукты
67 Морепродукты
Мойва
13,1
11,7
0
159 Морепродукты
Навага
Налим
Окунь
морской
Окунь
речной
Осетр
16,71
18,6
1,3
0,8
0
0
78 Морепродукты
85 Морепродукты
17,4
5,5
0
123 Морепродукты
18,3
16,5
0,7
10,5
0
0
80 Морепродукты
161 Морепродукты
Осьминог
18,5
0
0
74 Морепродукты
Палтус
18,5
3,2
0
106 Морепродукты
12
13.
ВИДЕТЬ ЗАКОНОМЕРНОСТИМЕЖДУ ЗНАЧЕНИЯМИ
№3
13
14.
ВИДЕТЬ ЗАКОНОМЕРНОСТИ МЕЖДУЗНАЧЕНИЯМИ
№3
https://therooster.com/blog/strange-correlation-between-nicholas-cage-and-people-drowning-pools
14
15.
ВИЗУАЛИЗАЦИЯ И ИНФОГРАФИКА• Визуализация данных — это метод науки и статистики.
• Инфографика — объект дизайна.
Визуализация данных может быть частью инфографики. Это такие элементы,
как график, диаграмма, гистограмма и т.п.
Инфографика рассказывает историю, а визуализация — просто
демонстрирует данные.
15
16.
ИНФОГРАФИКАНаличие интерпретации данных делает
визуализацию инфографикой.
https://fingramota.econ.msu.ru/sys/raw.php?o=4207&p=attachment
Визуализация данных — это инструмент
анализа, она помогает делать выводы.
Инфографика — это готовые выводы,
оформленные и структурированные
показатели и закономерности .
16
17.
ИНФОГРАФИКА ИЛИ ВИЗУАЛИЗАЦИЯ?17
18.
ИНФОГРАФИКА ИЛИ ВИЗУАЛИЗАЦИЯ?18
19.
ИНФОГРАФИКА ИЛИ ВИЗУАЛИЗАЦИЯ?19
20.
УГЛУБЛЕНИЕ В ПОНЯТИЯ• Цифровое искусство - направление в медиаискусстве, основанное на использовании
информационных (компьютерных) технологий, результатом которой являются
художественные произведения в цифровой форме
• Информационный дизайн - отрасль дизайна, практика художественнотехнического оформления и представления различной информации с учётом
эргономики, функциональных возможностей, психологических критериев
восприятия информации человеком, эстетики визуальных форм представления
информации и некоторых других факторов
• Инфографика - использование визуальных средств для изображения того, что мы
не можем увидеть или понять из информации, представленной в другой форме
• Визуализация данных - нарисованные в графическом виде данные
20
21.
АЛГОРИТМ РАБОТЫ21
22.
СБОР ДАННЫХWeb scraping (веб-сбор или извлечение веб-данных) – процесс
извлечения информации с веб-сайтов при помощи специальных
программ.
Парсинг данных – современный способ автоматизации сбора и
обработки информации (из интернета). Для этого
используются специальные программы – парсеры (сайтов). Они
собирают неструктурированную информацию, преобразуют ее и
выдают в удобном виде.
22
23.
ЧТО МОЖНО ИСПОЛЬЗОВАТЬ?1. Готовые сервисы:
https://yandex.ru/turbo?text=https%3A%2F%2Fblog.ingate.ru%2Fdetail%2F5-servisov-dlya-parsinga-auditoriiv-sotssetyakh%2F
https://umi.ru/blog/parsing/
https://vc.ru/services/64112-10-instrumentov-pozvolyayushchih-parsit-informaciyu-s-saytov-vklyuchaya-cenykonkurentov-i-pravovaya-ocenka
https://chrome.google.com/webstore/detail/scraper/mbigbapnjcgaffohmbkdlecaccepngjd - Scraper
2. API (Application programming interface) социальных сетей
API — это специальный интерфейс программы или приложения (библиотеки классов и процедур), с
помощью которого одна программа/приложение может взаимодействовать с другой. С помощью API
различные программы и приложения могут использовать функции и ресурсы друг друга. Это своего
рода "язык программ", на котором они разговаривают и обмениваются данными и информацией.
Примеры использования API:
Яндекс: API позволяет взаимодействовать с многими сервисами Яндекса: Погода, Директ
Вконтакте: с помощью API реализована функция отложенного постинга Вконтакте через сторонние
приложения и сайты.
3. Писать самим (Python, R)
23
24.
Сбор данных в Интернете на языке R PDFАвтор: Д. А. Храмов
Скрапинг веб-сайтов с помощью
Python PDF
Автор: Райан Митчелл
24
25.
АНАЛИЗ ДАННЫХ25
26.
АНАЛИЗ ДАННЫХБазовые операции по обработке данных
26
27.
АНАЛИЗ ДАННЫХОбработка данных в зависимости от целей проведения
обработки имеет количественные и качественные аспекты
27
28.
АНАЛИЗ ДАННЫХ28
29.
АНАЛИЗ ДАННЫХ29
30.
3031.
АЛГОРИТМ РАБОТЫ31
32.
ЭТАП ПРОЕКТИРОВАНИЯПеред созданием отчета:
1. Формируем гипотезы и ставим цель: задаем
вопросы, что должно быть отображено?
2. Исследуем данные: определяем метрики,
классифицируем переменные.
3. Делаем эскиз диаграмм, связанных одной
темой.
4. Добавляем пояснения, элементы
интерактивности
Пример о том как подобрать собаку
33.
https://prezi.com/ (VPN)33
34.
• Визуализация — это традиционные схемы играфики или это все, что способно иллюстрировать
данные, и есть визуализация, и не имеет значения,
что это: произведение data-арта или таблица в
Microsoft Excel.
ОПРЕДЕЛЕНИЯ
• Информационный дизайн — отрасль дизайна,
практика художественно-технического оформления
и представления различной информации с учётом
эргономики, функциональных возможностей,
психологических критериев восприятия
информации человеком, эстетики визуальных форм
представления информации и некоторых других
факторов.
34
35.
Инфогра́фика (от лат. informatio — осведомление,разъяснение, изложение; и др.-греч. γραφικός —
письменный, от γράφω — пишу) — это графический способ
подачи информации, данных и знаний, целью которого
является быстро и чётко преподносить сложную
информацию.
ОПРЕДЕЛЕНИЕ
Инфографика, чаще всего используется для следующих
целей:
1) Показать изменение с течением времени (пример: рост
безработицы или инфляции);
2) сравнить два или более явления (пример: BBC сделала
анимированную графику, чтобы показать число
пострадавших в войне во Вьетнами и число пострадавших во
Второй мировой войне);
3) показать связи (пример: сопоставление спортивных
результатов команд и уровней зарплат в командах);
4) сделать акцент на самом главном;
5) структурировать большое количество информации и др
35
36.
Power BIKlipfolio
QlikView
https://habr.com/ru/company/newprolab/blog/349186/ сравнение BI-платформ
https://netology.ru/blog/7-services-data-visualization - сервисы для
визуализации
37.
ТАБЛИЧНЫЙ ТИП ДАННЫХ37
38.
ОПРЕДЕЛЕНИЕ• Переменная – это эмпирически наблюдаемое
свойство некоторого явления, которое может
принимать более одного значения.
38
39.
ВИДЫ ПЕРЕМЕННЫХКоличественные (quantitative)
Категориальные (качественные)
Непрерывные (интервальные, interval)
Номинальные (nominal)
Дискретные (нормативные, ratio)
• Бинарные
• Мультиноминальные
Порядковые (ordinal)
39
40.
КОЛИЧЕСТВЕННЫЕИнтервальные
Нормативные
интервалы между точками измерения
одинаковы,
ноль означает отсутствие того, что вы
измеряете,
при значении ноль то, что вы измеряете,
не отсутствует.
выражены ограниченным набором
значений.
40
41.
КВИЗ• Разбалловка заданий
• Специальность в университете
• Рейтинг продукта на OZON
• Географические координаты
• Летальный исход
42
42.
КВИЗ• Разбалловка заданий
Нормативный
• Специальность в университете
Номинальный
• Рейтинг продукта на OZON
Порядковый
• Географические координаты
Интервальный
• Летальный исход
Бинарный
43
43.
1. Графики – отражают величины, изменяющиеся современем. Соотношение изображается с помощью
кривых на координатной сетке;
2. Диаграммы рассеивания используются чтобы
показать взаимоотношения отдельных значений.
Данные привязаны к двум осям, но точки не
соединяются между собой кривой.
ЭЛЕМЕНТЫ
ИНФОГРАФИКИ
3. Линейные и столбчатые диаграммы –
сопоставление двух или нескольких величин,
изображенных как столбцы.
4.Круговые диаграммы – сравнение долей частей в
составе целого
5. Пузырьковые диаграммы – сравнение величин с
помощью кругов, масштабированных
пропорционально соизмеряемым величинам.
6.Таблицы – данные в виде рядов или колонок.
44
44.
7.Хронология – события или данные, отражающие
ключевые исторические события или события жизни
человека, места или проблемы, выстроенные в
хронологическом порядке в виде календаря,
горизонтальной или вертикальной линии, иногда по
кругу.
8. Пошаговая инструкция – краткое руководство,
как поступать в типичном или экстренном случае.
ЭЛЕМЕНТЫ
ИНФОГРАФИКИ
9. Блок-схема показывает устройство или
взаиморасположение отдельных элементов чеголибо. Фамильное дерево, описание структуры
организаций, структура производственных
процессов.
10. Рисунок – изображение объекта в разрезе или
сверху, объясняющее принцип действия или
устройство действия чего-либо.
11. Карта – быстрый способ снабдить читателя
данными о географическом положении объекта.
45
45.
https://datayoga.ru/vizcards46
46.
4747.
КЛАССИФИКАЦИЯ ДИАГРАММ ИПРИМЕРЫ РЕШЕНИЙ
• http://chartmaker.visualisingdata.com/
• Python, R, D3 - https://www.data-to-viz.com/
• D3 - https://github.com/vizuly/viz/tree/master
• https://datavizcatalogue.com/search.html
• https://datavizproject.com/
48
48.
ПРАВИЛА ВИЗУАЛИЗАЦИИ1. Правильный тип графика
1. Не больше 3-5 значений круговой диаграммы.
2. Сумма значений в круговой диаграмме = 100%.
https://netology.ru/blog/11-pravil-vizualizacii-dannykh
49
49.
ПРАВИЛА ВИЗУАЛИЗАЦИИ2. Логический порядок
Отображение значений в порядке, отображающем вашу цель.
50
50.
ПРАВИЛА ВИЗУАЛИЗАЦИИ3. Простой дизайн
Дизайн не должен препятствовать пониманию или искажать данные
51
51.
ПРАВИЛА ВИЗУАЛИЗАЦИИ4. Легкое сравнение данных
Показывайте соотношение между данными. Если разбить однотипную информацию на много
отдельных графиков, визуализация становится бессмысленной.
52
52.
ПРАВИЛА ВИЗУАЛИЗАЦИИ5. Минимум элементов
Загромождение ненужной информацией затрудняет восприятие.
53
53.
ПРАВИЛА ВИЗУАЛИЗАЦИИ6. Не перегружайте информацией
Когда необходимо визуализировать много разных типов данных и категорий, целесообразнее
разделять диаграмму на несколько частей.
54
54.
ПРАВИЛА ВИЗУАЛИЗАЦИИ7. Понятный и одинаковый формат значений и подписей
Следите, чтобы формат был единый. Если вы решили показать один знак после запятой, то
сделайте так для всех подписей данных, а не выборочно.
55
55.
ПРАВИЛА ВИЗУАЛИЗАЦИИ8. Понятный и одинаковый формат значений и подписей
Следите, чтобы всегда у вашей диаграммы было полное понятное название и все необходимые
подписи, иначе появляется риск неверного истолкования.
56
56.
ПРАВИЛА ВИЗУАЛИЗАЦИИ9. Общепринятые цветовые решения
Есть несколько основных категорий, которые у нас всегда ассоциируются с определенным цветом:
1. положительные и отрицательные значения
2. да/нет, согласен/не согласен
3. мужчины и женщины
4. прочее/другое/остальное/нет ответа/затрудняюсь ответить
57
57.
ПРАВИЛА ВИЗУАЛИЗАЦИИ10. Минимум типов диаграмм
Используйте один вид диаграммы для однотипных данных
58
58.
ПРАВИЛА ВИЗУАЛИЗАЦИИ11. Единая цветовая палитра
Придерживайтесь одной цветовой гаммы
59
59.
ПОЛЕЗНАЯ ЛИТЕРАТУРА• https://datayoga.ru/
• Литература:
• https://tableau.pro/poleznyashki
• https://t.me/ds_notes
• https://disk.yandex.ru/i/RZlgFnLBMQN7gw
• https://t.me/data_analysis_ml
• Основные определения https://tableau.pro/datascientist
• http://books.irrp.org.ua/data-design/dannye-dizajn/
60
60.
1. Регистрация2. Скачать установщик
TABLEAU
62
61.
NN
докладов докладчиков
ДОКЛАДЫ
Запись:
https://disk.yandex.ru/i/QQsW8BKQuYcnGg
Тема
Обзор no-code инструментов
визуализации данных
2
1
Data Art - искусство данных
1
KNIME
2
Apache Superset
1
Datrics.ai
Использование ChatGPT при
разработке дашборда
1
2
d3 + Observablehq
Визаулизация данных на языке R 2
2
QGIS
Обзор API пространственных
данных
1
Использование облачных функций
в дашборде Datalens / Обзор
бессерверных технологий Яндекса 2
Любой из инструментов, исключая
перечисленные здесь
*
Описание типов диаграмм в одном
из представленных семейств,
реализация на своих данных
данных с использованием любого
инструмента
*
Своя тема
2
1
2
2
1
1
2
2
2
2
2
63
informatics