Similar presentations:
Способы представления данных и элементарный анализ
1.
Способы представленияданных и элементарный
анализ
2.
Результаты исследования - отчеты• Основой для любого ответа является программа
социологического исследования;
• Основа для любой программы – проблема исследования и
проблемная ситуация;
• В зависимости от типа исследования структура отчета может
трансформироваться;
• Отчет может трансформироваться под требования заказчика;
• Основные операции: поиск общего (обобщение на данных) и
различий (выявление особенностей в данных).
3.
Раздел – задача – пропорция• Под каждую задачу исследования обычно готовится свой раздел.
• Раздел включает формулирование того, как задача работает на
цель, какой элемент проблемы раскрывает.
• Какая генеральная гипотеза связана с задачей? Какие частные
гипотезы связаны с разделом?
• Вопрос – блок информации раздела (иногда переменные или
элементы наблюдений):
• линейный анализ, потом анализ соответствий – подтверждена или
опровергнута частная гипотеза;
• если слова респондента – что общего, какие различия – типика.
4.
Способы представления данныхТекст
Индексы
Талицы
Диаграммы
• Логичное и последовательное описание
• От частного к общему
• От особенностей к обобщению и выделению различий
• Статистические показатели с определенными выводами
• Часто цифры по правилам в «тексте»
• Могут быть организованы в таблицы для сравнения/сопоставления
• Группировка и классификация данных
• Могут быть описательные таблицы по 1 переменной
• Таблицы-сопоставления по 2 и более переменным
• Визуальная представленность данных
• Должны быстро считываться или пониматься
• «Работать» на донесение идеи или мысли
5.
Индексы или статистические показатели• Среднее, медиана, мода, стандартное отклонение, асимметрия,
дисперсия, квартили, статистическая значимость, хи квадрат, ттест, степень сопряженности, коэффициенты корреляции,
факторная нагрузка, регрессионное уравнение, различные
агрегаторы.
• Всегда имеют текстовое описание по определенным (жестким)
правилам, которые предполагают и формулировки вывода – из
статистики и математики.
• Могут предъявляться в виде таблиц и графиков для
сопоставления данных: поиска различий или сходств,
определения динамики во времени.
6.
Что должно быть у таблицы?• Номер
• Название
• Подписи типов данных (если %, то база расчета!!!)
• Примечания к таблице*
• Отсутствие сокращений или принятые/разъясненные сокращения
• Визуальное единство
• Читабельность
• Возможны условные обозначения (с легендами) и цветное
форматирование, но должно быть уместно
• Если в тексте – то по ширине всей страницы!!!
• Следите за шрифтами и отступами во всем документе.
7.
Таблицы – типы в социологии• Таблицы линейного распределения (частотные таблицы, «линейки») –
распределение ответов респондентов на вопрос, часто в абсолютных значениях и в
% (от опрошенных, от ответивших на вопрос, от какой-то подгруппы/подвыборки);
• Таблицы сопоставления данных или таблицы сопряженности (парные таблицы,
«парники») – инструмент описания распределения ответов респондентов по двум
переменным, часто первичный инструмент проверки гипотез (как правила % внутри
«подгруппы», от какой-то группы по (независимой) переменной);
• Многомерные таблицы (чаще всего трех) – таблицы в построении которых участвует
более 2 переменных (редко используются, сложны для восприятия);
• Таблицы сравнения индексов/показателей – необходимы для сравнение
статистических/аналитических индексов или показателей в рамках различных
характеристик или групп (важны подписи и корректность сравнения – разделы
дескриптивной статистики);
8.
Пример: таблица линейногораспределения
9.
Пример: таблица линейногораспределения
10.
Пример: таблица сопряженности11.
12.
13.
Диаграммы и графики• Визуальное представление данных необходимо для донесения какойто мысли!!!
• Тип визуализации, все основные элементы подчиняются
демонстрации этой мысли.
• Общие требования к диаграммам схожи с табличными: обязательно
нумерация, подпись названия, легенда, стилистическое и визуальное
единство.
• Тип диаграммы зависит от шкалы, типа вопроса и аналитической
задачи!!!
• Перед тем как «делать» отвечаем на вопрос: Для чего? Что мы хотим
показать или рассказать? На что хотим обратить внимание?
14.
Варианты представленияПродажи
Круговая диаграмма –
одновариантный вопрос,
категориальный тип шкалы,
ограниченное число категорий
(не более 6), доли категорий
четко различаются; если
упорядоченная порядковая –
круг по порядку!!!
9%
10%
23%
58%
Кв. 1
Кв. 2
Кв. 3
Кв. 4
15.
Варианты представленияДоли пользователей продуктов
36
Категория 4
Продукт
Линейчатая диаграмма –
одновариантный или
многовариантный вопрос,
категориальный тип шкал
(можно упорядоченную
порядковую, но нежелательно),
показывает иерархии (в ответах)
за счет сортировки.
Могут использоваться для
сопоставления/сравнения
данных по двум переменным
(категориальным).
32
Категория 3
24
Категория 2
Категория 1
18
% респондентов-пользователей от
опрошенных
16.
Варианты представленияГрафики (графики с областями) –
используются только на
метрических шкалах, чаще всего
непрерывных или связанных со
временем (распределение
показателя во времени).
Могут использоваться для
сопоставления данных (по
метрическим переменным в
разрезе времени с
ОДИНАКОВЫМ измерителем).
НАЗВАНИЕ ДИАГРАММЫ
Ряд 1
Ряд 2
35
30
25
20
15 32
32
28
28
21
10
5 12
12
12
12
0
05.01.2002
06.01.2002
07.01.2002
08.01.2002
15
09.01.2002
17.
Варианты представленияГистограмма – используется
только для метрических
переменных, преимущественно
дискретных, чтобы показать
частоту чего-то.
Часто совмещает в себе элемент
группировки по интервалам.
18.
Варианты представленияРяд 1
Ряд 2
Ряд 3
6
5
Название оси
Столбчатые диаграммы
сравнения – преимущественно
для метрических (дискретных)
шкал в сравнении по
упорядоченной порядковой
шкале.
Внимание относительно
порядка!!!!
Могут быть разные модели
соотнесения данных.
4
3
2
1
0
Категория 1
Категория 2
Категория 3
Название оси
Категория 4
19.
Столбчатые диаграммы сравненияНазвание диаграммы
Название диаграммы
14
100%
90%
12
80%
10
70%
60%
8
50%
6
40%
30%
4
20%
2
10%
0
0%
Категория 1
Категория 2
Категория 3
Ряд 1
Ряд 3
Ряд 2
Категория 4
Категория 1
Категория 2
Ряд 1
Ряд 2
Категория 3
Ряд 3
Категория 4
20.
Варианты представленияТочечная диаграмма или
диаграмма рассеивания –
сопоставление данных по двум
метрическим шкалам
(дискретным, реже
непрерывным - области).
Может служить основанием для
группировки данных.
Может учитывать «частоту
встречаемости» – пузырьковые
диаграммы.
Значения Y
10
9
8
7
6
5
4
3
2
1
0
0
2
4
6
8
10
12
21.
Варианты представления• Бокс-плоты (диаграммы
ящики, ящики с усами,
коробочки с усами) –
используются для
сопоставления данных по
метрическим переменным в
зависимости от
категориальной.
• В основе лежит элементарная
дескриптивная статистика.
22.
Визуализация данных• По преимуществую для визуализации используем Excel.
• Сегодня много специального ПО, в т.ч. совмещающего анализ
данных с визуализацией (дополнительно будем разбирать
https://datastudio.google.com/ и https://public.tableau.com/enus/s/download - необходима регистрация).
• Внимание к деталям, единому стилю, общее правлю –
лаконичность и сдержанность.
• Основное – донести мысль, а не забить картинкой.
• Обращайте внимание на связанность данных, пытайтесь
рассказать историю в вашем отчете (базируясь на цели и задачах).
23.
Ссылки для просмотра• Примеры хороших таблиц:
https://www.monitoringjournal.ru/index.php/monitoring/issue/archive
• Грамотное оформление графиков и текста:
• https://tedo.ru/#researches
• Гид по выбору графиков (английский):
https://chart.guide/charts/chart-choosing/