Similar presentations:
Инфографика и визуализация данных
1.
Инфографика ивизуализация данных
ОБЗОРНАЯ ЛЕКЦИЯ
АННА ГЕОРГИЕВНА БАЛАХЧИ
2.
Часть 1. Философия и история3.
Информационный подход кистории развития цивилизации
История
человечества
может
рассматриваться
как
закономерная
последовательность технологических
революций.
Что такое технологическая революция?
революция радикальное изменение
Технологическая революция –
радикальное изменение
технологическая технологический уклад
доминирующего в обществе технологического уклада, который, в
уклад средства и способы организации производства и
свою очередь, определяется средствами и способами организации
жизнеобеспечения
общественного производства и жизнеобеспечения общества.
Пример:
компьютерные технологии позволили автоматизировать как
большинство производственных процессов, так и процессы, сопровождающие
человека в быту
4.
Необходимые условия для перехода общества накачественно новый уровень технологического развития
создает информационная революция.
Информационная революция – это
изменение
инструментальной
основы,
способа передачи и хранения информации, а
также объема информации, доступной
активной части населения.
ВИнформационная
основе каждой
революция
технологической
изменяет
революции
лежит
общественное
информационная
сознание, делает его
революция
все более
глобальным
Сколько
информационных
революций произошло за всю
историю развития человеческого
общества?
5.
Основные информационные революцииПервая информационная революция заключается в
появлении языка и членораздельной человеческой речи.
Использование языка в практической деятельности стало
информационной основой создания первых технологий.
Вторая
информационная
революция
связана
с
изобретением письменности. Люди научились отчуждать
знания и фиксировать их на материальных носителях в виде
рисунков, чертежей, условных знаков.
Третья информационная революция началась в эпоху
возрождения и связана с изобретением книгопечатания, которое
следует
признать
одной
из
первых
эффективных
информационных технологий.
6.
Основные информационные революцииЧетвертая информационная революция началась в XIX
веке, когда были изобретены и стали все более широко
распространяться такие новые средства информационной
коммуникации, как радио, телефон и телевидение.
Пятая информационная революция началась в 50-е годы
XX века, т. е. с того времени, когда в социальной практике стали
использоваться средства цифровой вычислительной техники.
Шестая информационная революция это развивающийся
на наших глазах процесс глобальной информатизации
общества.
7.
Часть 2. Большие данные иистории, которые они могут
рассказать
8.
Схема ростакомпьютерных приложений и их пользователей
9.
Проблема «больших данных» - рост данных стал опережатьразвитие технологий хранения и обработки информации
Объем создаваемой информации в мире (в эксабайтах) и доступные
ресурсы хранения данных (источник: DigitalUniverseStudy)
10.
"Data is the new oil"BigData / Data Mining
11.
Три основных характеристики,определяющие понятие BigData
1. Объем данных – широчайшие объемы данных, которые
стремительно растут с каждым днем;
2. Разнородность, многообразие данных – используются разные
источники данных (внешние и внутренние, структурированные и
неструктурированные), это могут быть таблицы, видео, текст,
электронная почта, социальные сети, биржевые торги и пр.
3. Скорость – оперативное реагирование, быстрый анализ данных
в случае необходимости.
BigData – комплексное понятие: это данные большого объема,
технология их обработки, проекты, рынок и даже компании,
активно использующие эту технологию.
12.
Данныеогромные
BIG
DATA
Методы
Технологии
Инструменты
Сбор
Хранение
Обработка
13.
Data Mining (рус. добыча данных, интеллектуальный анализданных) — собирательное название, используемое для
обозначения совокупности методов обнаружения в данных
ранее неизвестных, нетривиальных, практически полезных и
доступных интерпретации знаний, необходимых для принятия
решений в различных сферах человеческой деятельности.
14.
ДанныеDATA
MINING
Методы
Технологии
Инструменты
Обработка
15.
Часть 3. Визуализация данныхМы все заражены вирусом информационного дизайна.
Информация льется в наши глаза из самых разных
источников .
Мы все визуалы сейчас, нам всем подавай визуальный
аспект информации
16.
17.
ЗрениеОсязание
Слух и запах
Вкус
18.
Визуализация информации позволяет выделять паттерны исвязи, которые имеют значение, картинка о данных
рассказывает историю и позволяет нам сосредоточиться только
на важной информации
19.
Веселый взгляд на старение20.
Па́ттерн (англ. pattern — образец, шаблон; форма, модель;схема, диаграмма) — схема-образ, действующая как
посредствующее представление, или чувственное понятие,
благодаря которому в режиме одновременности восприятия
и мышления выявляются закономерности, как они
существуют в природе и обществе.
Сегодня именно дизайнерскими средствами осуществляется
улучшения восприятия контента.
Восприятие мира «через глаз» становится особенно
существенным фактором и важным аспектом коммуникации.
21.
ДэвидМакКэндлесс
22.
ДоходыОПЕК – 780
млрд в год
Военные расходы США – 3 000 млрд
11,900 миллиардов
3 млрд
пожертвования
300 млрд
благотворительность
Доходы –
нажива
пожертвования
23.
Как раздувают из мухи слона – наши страхиСвиной
грипп
2000
Птичий
грипп
SARS
2000
2001
2002 2003
2004
2005
2006
2007
2008
2009
24.
Откуда эти пики два раза в год, один раз весной (в канун Пасхи), а потом заодну-две недели до Нового года, а есть еще мини-пик каждый понедельник, и
очень спокойное ровное лето?
25.
Популярный фильм: Journalism at the Age of Datahttps://www.youtube.com/channel/UCULVvxVexR2M5gid
1VnG7lA
Первая часть видео – введение, в котором исследователи,
популяризующие визуализацию в областях искусства и
коммуникации, рассказывают, в чем заключается их работа.
Вторая часть видео посвящена применению визуализации данных
в журналистике.
В третьей части рассказывается о техниках визуализации и способах
подачи информации.
В четвертой части эксперты в области инфографики обсуждают
проблему, появившуюся с приходом больших данных: графика и
способ визуализации становятся важнее контента
Часть пятая: жизнь как поток данных
Шестая часть о том, как можно изучать данные и выявлять скрытый
в них смысл и какими инструментами для этого пользоваться.
Часть седьмая продвинутые технологии и инструменты.
Восьмая часть: онлайн сервисы и ресурсы для начинающих.
26.
Некоторый интересные визуализациииз фильма
Проекты The New York Times:
https://archive.nytimes.com/www.nytimes.com/interactive/2009/07/31/business/2
0080801-metrics-graphic.html - Уровень безработицы в зависимости от
социально-демографических характеристик.
https://archive.nytimes.com/www.nytimes.com/interactive/2009/07/31/business/200
80801-metrics-graphic.html - Как различные группы людей проводят свой день.
https://fivethirtyeight.com/features/gun-deaths/ - смерти от огнестрельного оружия
в США
Проекты интерактивной студии MSNBC.com
http://www.nbcnews.com/id/30072578#.XeRQVyMueUl - карта,
показывающая все ураганы, произошедшие в США с 1900 года.
Проекты сайта BBC News
https://www.bbc.com/news/business-13366011 -интерактивный график,
показывающий ежегодный дефицит или профицит разных стран
http://news.bbc.co.uk/2/hi/in_depth/uk/2009/crash/8414354.stm - гибель людей на
дрогах Великобритании
27.
28.
New York Times«Компьютеризированные репортажи»
http://flowingdata.com/2016/05/10/who-is-older-andyounger-than-you/ -кто старше, а ко моложе
http://flowingdata.com/2015/09/23/years-you-haveleft-to-live-probably/
https://flowingdata.com/category/projects/dataunderload/
29.
Facebook использовал обновление статусов для определениясамого счастливого дня в году.
Сайт онлайн-знакомств OkCupid использовал размещаемую
на нем информацию для оценки того, в чем и как люди лгут,
пытаясь сделать свое цифровое «я» лучше, чем есть на
самом деле .
Так, Facebook обнаружил, что самый счастливый день — это
День благодарения
OkCupid выяснил, что люди склонны к преувеличениям чаще
всего тогда, когда говорят о своем росте, и любят приписать
себе примерно 5 лишних сантиметров.
30.
Интерактивные истории винфографике
31.
Джонатан Харрис и Сеп Камвар, сервис «Все у нас хорошо».http://wefeelfine.org Анатомия эмоций и чувств
32.
33.
http://www.visitorville.com/Ресурс, как игра
34.
Жизнь как поток данных35.
https://daytum.com/Информация о себе
36.
37.
Часть 3. Инструменты38.
Сбор данныхWeb scraping (веб-сбор или извлечение веб-данных) – процесс
извлечения информации с веб-сайтов при помощи
специальных программ.
Парсинг данных – современный способ автоматизации сбора и
обработки информации (из интернета). Для этого
используются специальные программы – парсеры (сайтов).
Они собирают неструктурированную информацию,
преобразуют ее и выдают в удобном виде.
39.
Что можно использовать?1. Готовые сервисы:
https://yandex.ru/turbo?text=https%3A%2F%2Fblog.ingate.ru%2Fdetail%2F5-servisovdlya-parsinga-auditorii-v-sotssetyakh%2F
https://umi.ru/blog/parsing/
https://vc.ru/services/64112-10-instrumentov-pozvolyayushchih-parsit-informaciyu-ssaytov-vklyuchaya-ceny-konkurentov-i-pravovaya-ocenka
https://chrome.google.com/webstore/detail/scraper/mbigbapnjcgaffohmbkdlecaccepngjd
- Scraper
2. API (Application programming interface) социальных сетей
API — это специальный интерфейс программы или приложения (библиотеки классов и
процедур), с помощью которого одна программа/приложение может
взаимодействовать с другой. С помощью API различные программы и приложения
могут использовать функции и ресурсы друг друга. Это своего рода "язык программ", на
котором они разговаривают и обмениваются данными и информацией.
Примеры использования API:
Яндекс: API позволяет взаимодействовать с многими сервисами Яндекса: Погода, Директ
Вконтакте: с помощью API реализована функция отложенного постинга Вконтакте через
сторонние приложения и сайты.
3. Писать самим (Python, R)
40.
Сбор данных в Интернете на языке R PDFАвтор: Д. А. Храмов
Скрапинг веб-сайтов с помощью
Python PDF
Автор: Райан Митчелл
41.
Анализ данных42.
Анализ данныхБазовые операции по обработке данных
43.
Анализ данныхОбработка данных в зависимости от целей проведения
обработки имеет количественные и качественные аспекты
44.
Анализ данных45.
Анализ данных46.
47.
48.
49.
Инфогрфика и визуализация данныхВизуализация — это традиционные схемы и графики или
это все, что способно иллюстрировать данные, и есть
визуализация, и не имеет значения, что это: произведение
data-арта или таблица в Microsoft Excel.
Информационный дизайн — отрасль дизайна, практика
художественно-технического оформления и представления
различной информации с учётом эргономики,
функциональных возможностей, психологических критериев
восприятия информации человеком, эстетики визуальных
форм представления информации и некоторых других
факторов.
50.
Инфогра́фика (от лат. informatio — осведомление, разъяснение,изложение; и др.-греч. γραφικός — письменный, от γράφω —
пишу) — это графический способ подачи информации, данных и
знаний, целью которого является быстро и чётко преподносить
сложную информацию.
Инфографика, чаще всего используется для следующих целей:
1) Показать изменение с течением времени (пример: рост
безработицы или инфляции);
2) сравнить два или более явления (пример: BBC сделала
анимированную графику, чтобы показать число пострадавших в
войне во Вьетнами и число пострадавших во Второй мировой
войне);
3) показать связи (пример: сопоставление спортивных
результатов команд и уровней зарплат в командах);
4) сделать акцент на самом главном;
5) структурировать большое количество информации и др
51.
Классификация инфографики1) Графики – отражают величины, изменяющиеся со временем. Соотношение
изображается с помощью кривых на координатной сетке;
2) Диаграммы рассеивания используются чтобы показать взаимоотношения отдельных
значений. Данные привязаны к двум осям, но точки не соединяются между собой кривой.
3) Линейные и столбчатые диаграммы – сопоставление двух или нескольких величин,
изображенных как столбцы.
4) Круговые диаграммы – сравнение долей частей в составе целого
5) Пузырьковые диаграммы – сравнение величин с помощью кругов, масштабированных
пропорционально соизмеряемым величинам.
6) Таблицы – данные в виде рядов или колонок.
7) Хронология – события или данные, отражающие ключевые исторические события или
события жизни человека, места или проблемы, выстроенные в хронологическом порядке
в виде календаря, горизонтальной или вертикальной линии, иногда по кругу.
8) Пошаговая инструкция – краткое руководство, как поступать в типичном или
экстренном случае.
9) Блок-схема показывает устройство или взаиморасположение отдельных элементов
чего-либо. Фамильное дерево, описание структуры организаций, структура
производственных процессов.
10) Рисунок – изображение объекта в разрезе или сверху, объясняющее принцип действия
или устройство действия чего-либо.
11) Карта – быстрый способ снабдить читателя данными о географическом положении
объекта.
52.
Правило выбора подходящей диаграммы53.
Power BIKlipfolio
QlikView
https://habr.com/ru/company/newprolab/blog/349186/ сравнение BI-платформ
https://netology.ru/blog/7-services-data-visualization - сервисы для
визуализации
54.
55.
https://habidatum.com/ИЗУЧЕНИЕ ВРЕМЕННЫХ МОДЕЛЕЙ АКТИВНОСТИ
Позволяет визуализировать данные в трехмерном
пространстве (долгота, широта и время)
56.
57.
58.
*Интерактивные опросыаудитории
59.
Инструментыhttp://directpoll.com/
https://www.polleverywhere.com/app/powerpoint/win
60.
Часть 4. Наши кейсы61.
ГОРОД В РЕЛЬЕФЕ И РЕЛЬЕФ АКТИВНОСТИ В ГОРОДЕУдалось определить популярность
местоположений социальной
активности горожан, соотнести ее с
уровнем жизни районов и
ландшафтом города, а также узнать
настроение в конкретной точке
пространства, на протяжении
некоторого отрезка времени.
62.
http://isubusiness.ru/ИНСТРУМЕНТ ИССЛЕДОВАНИЯ И ПРОГНОЗИРОВАНИЯ ДЕЯТЕЛЬНОСТИ
ПРЕДПРИЯТИЙ И ТЕНДЕНЦИЙ БИЗНЕСА (НА ПРИМЕРЕ ПРЕДПРИЯТИЙ
ОБЩЕСТВЕННОГО ПИТАНИЯ ГОРОДА ИРКУТСКА)
63.
http://isubusiness.ru/ИНСТРУМЕНТ ИССЛЕДОВАНИЯ И ПРОГНОЗИРОВАНИЯ ДЕЯТЕЛЬНОСТИ
ПРЕДПРИЯТИЙ И ТЕНДЕНЦИЙ БИЗНЕСА (НА ПРИМЕРЕ ПРЕДПРИЯТИЙ
ОБЩЕСТВЕННОГО ПИТАНИЯ ГОРОДА ИРКУТСКА)
64.
65.
2011-2012г2012-2013г
66.
Наиболее посещаемые периоды1. 28.10.2012 – 11.11.2012 - День рекламиста, Посвящение в студенты
2. 25.11.2012 – 06.12.2012 - День открытых дверей
3. 19.03.2013 – 26.03.2013 – Студ.весна
4. 5.04.13-12.04.13 – Брейн-ринг по экономике
5. 19.04.13-26.04.13 - конференции
67.
5%3%
6%
27%
7%
Республика Бурятия
Приморский край
Хабаровский край
Санкт -Петербург
Читинская область
11%
Новосибирскя область
Красноярский край
Свердловская область
22%
19%
68.
КраснодарЕкатеринбург
Якутск
Нижний Новгород
Казань
Красноярск
Усть - Илимск
Новосибирск
Чита
Ангарск
Санкт - Петербург
Братск
Улан - Уде
Хабаровск
Владивосток
69.
70.
71.
72.
73.
74.
https://www.youtube.com/watch?v=DSy6euwKkA0&feature=emb_logo
informatics