15.51M
Category: sociologysociology

Способы представления данных и элементарный анализ

1.

Способы представления
данных и элементарный
анализ

2.

Результаты исследования - отчеты
• Основой для любого ответа является программа
социологического исследования;
• Основа для любой программы – проблема исследования и
проблемная ситуация;
• В зависимости от типа исследования структура отчета может
трансформироваться;
• Отчет может трансформироваться под требования заказчика;
• Основные операции: поиск общего (обобщение на данных) и
различий (выявление особенностей в данных).

3.

Раздел – задача – пропорция
• Под каждую задачу исследования обычно готовится свой раздел.
• Раздел включает формулирование того, как задача работает на
цель, какой элемент проблемы раскрывает.
• Какая генеральная гипотеза связана с задачей? Какие частные
гипотезы связаны с разделом?
• Вопрос – блок информации раздела (иногда переменные или
элементы наблюдений):
• линейный анализ, потом анализ соответствий – подтверждена или
опровергнута частная гипотеза;
• если слова респондента – что общего, какие различия – типика.

4.

Способы представления данных
Текст
Индексы
Талицы
Диаграммы
• Логичное и последовательное описание
• От частного к общему
• От особенностей к обобщению и выделению различий
• Статистические показатели с определенными выводами
• Часто цифры по правилам в «тексте»
• Могут быть организованы в таблицы для сравнения/сопоставления
• Группировка и классификация данных
• Могут быть описательные таблицы по 1 переменной
• Таблицы-сопоставления по 2 и более переменным
• Визуальная представленность данных
• Должны быстро считываться или пониматься
• «Работать» на донесение идеи или мысли

5.

Индексы или статистические показатели
• Среднее, медиана, мода, стандартное отклонение, асимметрия,
дисперсия, квартили, статистическая значимость, хи квадрат, ттест, степень сопряженности, коэффициенты корреляции,
факторная нагрузка, регрессионное уравнение, различные
агрегаторы.
• Всегда имеют текстовое описание по определенным (жестким)
правилам, которые предполагают и формулировки вывода – из
статистики и математики.
• Могут предъявляться в виде таблиц и графиков для
сопоставления данных: поиска различий или сходств,
определения динамики во времени.

6.

Что должно быть у таблицы?
• Номер
• Название
• Подписи типов данных (если %, то база расчета!!!)
• Примечания к таблице*
• Отсутствие сокращений или принятые/разъясненные сокращения
• Визуальное единство
• Читабельность
• Возможны условные обозначения (с легендами) и цветное
форматирование, но должно быть уместно
• Если в тексте – то по ширине всей страницы!!!
• Следите за шрифтами и отступами во всем документе.

7.

Таблицы – типы в социологии
• Таблицы линейного распределения (частотные таблицы, «линейки») –
распределение ответов респондентов на вопрос, часто в абсолютных значениях и в
% (от опрошенных, от ответивших на вопрос, от какой-то подгруппы/подвыборки);
• Таблицы сопоставления данных или таблицы сопряженности (парные таблицы,
«парники») – инструмент описания распределения ответов респондентов по двум
переменным, часто первичный инструмент проверки гипотез (как правила % внутри
«подгруппы», от какой-то группы по (независимой) переменной);
• Многомерные таблицы (чаще всего трех) – таблицы в построении которых участвует
более 2 переменных (редко используются, сложны для восприятия);
• Таблицы сравнения индексов/показателей – необходимы для сравнение
статистических/аналитических индексов или показателей в рамках различных
характеристик или групп (важны подписи и корректность сравнения – разделы
дескриптивной статистики);

8.

Пример: таблица линейного
распределения

9.

Пример: таблица линейного
распределения

10.

Пример: таблица сопряженности

11.

12.

13.

Диаграммы и графики
• Визуальное представление данных необходимо для донесения какойто мысли!!!
• Тип визуализации, все основные элементы подчиняются
демонстрации этой мысли.
• Общие требования к диаграммам схожи с табличными: обязательно
нумерация, подпись названия, легенда, стилистическое и визуальное
единство.
• Тип диаграммы зависит от шкалы, типа вопроса и аналитической
задачи!!!
• Перед тем как «делать» отвечаем на вопрос: Для чего? Что мы хотим
показать или рассказать? На что хотим обратить внимание?

14.

Варианты представления
Продажи
Круговая диаграмма –
одновариантный вопрос,
категориальный тип шкалы,
ограниченное число категорий
(не более 6), доли категорий
четко различаются; если
упорядоченная порядковая –
круг по порядку!!!
9%
10%
23%
58%
Кв. 1
Кв. 2
Кв. 3
Кв. 4

15.

Варианты представления
Доли пользователей продуктов
36
Категория 4
Продукт
Линейчатая диаграмма –
одновариантный или
многовариантный вопрос,
категориальный тип шкал
(можно упорядоченную
порядковую, но нежелательно),
показывает иерархии (в ответах)
за счет сортировки.
Могут использоваться для
сопоставления/сравнения
данных по двум переменным
(категориальным).
32
Категория 3
24
Категория 2
Категория 1
18
% респондентов-пользователей от
опрошенных

16.

Варианты представления
Графики (графики с областями) –
используются только на
метрических шкалах, чаще всего
непрерывных или связанных со
временем (распределение
показателя во времени).
Могут использоваться для
сопоставления данных (по
метрическим переменным в
разрезе времени с
ОДИНАКОВЫМ измерителем).
НАЗВАНИЕ ДИАГРАММЫ
Ряд 1
Ряд 2
35
30
25
20
15 32
32
28
28
21
10
5 12
12
12
12
0
05.01.2002
06.01.2002
07.01.2002
08.01.2002
15
09.01.2002

17.

Варианты представления
Гистограмма – используется
только для метрических
переменных, преимущественно
дискретных, чтобы показать
частоту чего-то.
Часто совмещает в себе элемент
группировки по интервалам.

18.

Варианты представления
Ряд 1
Ряд 2
Ряд 3
6
5
Название оси
Столбчатые диаграммы
сравнения – преимущественно
для метрических (дискретных)
шкал в сравнении по
упорядоченной порядковой
шкале.
Внимание относительно
порядка!!!!
Могут быть разные модели
соотнесения данных.
4
3
2
1
0
Категория 1
Категория 2
Категория 3
Название оси
Категория 4

19.

Столбчатые диаграммы сравнения
Название диаграммы
Название диаграммы
14
100%
90%
12
80%
10
70%
60%
8
50%
6
40%
30%
4
20%
2
10%
0
0%
Категория 1
Категория 2
Категория 3
Ряд 1
Ряд 3
Ряд 2
Категория 4
Категория 1
Категория 2
Ряд 1
Ряд 2
Категория 3
Ряд 3
Категория 4

20.

Варианты представления
Точечная диаграмма или
диаграмма рассеивания –
сопоставление данных по двум
метрическим шкалам
(дискретным, реже
непрерывным - области).
Может служить основанием для
группировки данных.
Может учитывать «частоту
встречаемости» – пузырьковые
диаграммы.
Значения Y
10
9
8
7
6
5
4
3
2
1
0
0
2
4
6
8
10
12

21.

Варианты представления
• Бокс-плоты (диаграммы
ящики, ящики с усами,
коробочки с усами) –
используются для
сопоставления данных по
метрическим переменным в
зависимости от
категориальной.
• В основе лежит элементарная
дескриптивная статистика.

22.

Визуализация данных
• По преимуществую для визуализации используем Excel.
• Сегодня много специального ПО, в т.ч. совмещающего анализ
данных с визуализацией (дополнительно будем разбирать
https://datastudio.google.com/ и https://public.tableau.com/enus/s/download - необходима регистрация).
• Внимание к деталям, единому стилю, общее правлю –
лаконичность и сдержанность.
• Основное – донести мысль, а не забить картинкой.
• Обращайте внимание на связанность данных, пытайтесь
рассказать историю в вашем отчете (базируясь на цели и задачах).

23.

Ссылки для просмотра
• Примеры хороших таблиц:
https://www.monitoringjournal.ru/index.php/monitoring/issue/archive
• Грамотное оформление графиков и текста:
• https://tedo.ru/#researches
• Гид по выбору графиков (английский):
https://chart.guide/charts/chart-choosing/
English     Русский Rules