Similar presentations:
Метод группировки (тема 14)
1.
Метод группировкиТема 14
2.
Группировка - это• Метод систематизации и обобщения первичных данных, в основе
которого лежит процедура деления изучаемой совокупности на
группы по какому-либо признаку
• Метод распределения совокупности на группы по какому-либо
признаку и определение размера этих групп
3.
Население Уральского региона в 1959-1970 гг., млн. чел*Год
Всего населения Городское население Сельское население
1959
17,5
10,1
7,4
1970
19,0
12,3
6,7
* Уральский экономический район. Основные итоги переписи 1989 г. Екатеринбург, 1991.
С. 2-5.
4.
Этапы группировки• Определение объекта исследования (статистическая
совокупность)
• Выбор группировочного признака с учетом решаемых задач
• Измерение группировочного признака (шкалы измерения:
номинальная, порядковая, интервальная)
• Распределение совокупности по группам и определение
размеров групп
5.
Группировочный признак – это …• Характеристика/свойство совокупности, которая исследуется
2 вида признаков:
- Количественные признаки
- Качественные признаки
6.
Качественный признак• Значения выражены вербально (номинальная шкала)
Пол – мужской
женский
Образование – нет
начальное
среднее
высшее
7.
Количественный признакВозраст, лет
• До 18
• 19—25
• 26—35
• 36—45
• 46– 55
• 56 и более
(интервальная шкала)
Число членов семьи, чел
•1
•2
•3
•4
•5
• 6 и более
(порядковая шкала)
8.
Интервальная шкалаДолжна быть
– равномерной
– Непрерывной
– Оптимальной
Формула Стреджерса
• K = (Xmax – Xmin) / (1 + 3,32* lg N),
• где
k – величина доверительного интервала;
Xmax – максимальное значение признака;
Xmin – минимальное значение признака;
N – число единиц наблюдения.
9.
Виды группировок• Типологическая
• Структурная
• аналитическая
10.
Типологическая группировка – процесс делениястатистической совокупности на качественно
разнородные группы
Таблица 1
Продукция промышленности Советской России в середине 20х гг. XX в.*
Год
Стоимость продукции, млн. руб.
Государственная
промышленность
Кооперативная
промышленность
Частная
промышленность
1924/25
6289,1
757,4
515,5
1925/26
8918,3
639,3
362,3
* Бокарев Ю. П. Крестьянское хозяйство и развитие промышленности Советской России в
середине 20-х гг. XX в. М., 1978. С.23 (Таблица дана в сокращении - Л. М.).
11.
Структурная группировка – процесс делениясовокупности на количественные группы
Таблица 3
Распределение крестьянских семей Свердловской области в середине 60-х гг. по числу
членов семьи, %*
Число членов семьи, чел
1
2
3
4
5
6 и более
Количество семей в % 9,1
20,3
22,1
19,0
13,6
15,9
* Составлено по материалам бюджетов колхозников за 1963 г. ГАСО.Ф.1813.Оп.14.Д.35003577.
12.
Аналитическая группировка – процесс делениясовокупности на группы по двум и более
признакам
Таблица 5
Распределение крестьянских семей в зависимости от пола главы семьи и его семейного
положения, %*
Семейное положение
Мужской
Состоит в браке
54,8
Не состоит в браке
2,7
* Составлено по бюджетам колхозников за 1963 год
Пол главы семьи
Женский
7,2
35,3
13.
Форма связи• Линейная/нелинейная
• Линейно зависимыми называют такие признаки, когда
изменение значений одного влияет на изменение значений
другого признака
• Прямая связь фиксируется в том случае, когда увеличение
значений одного признака ведет к увеличению значений другого
• Обратная связь – когда увеличение значений одного ведет к
уменьшению значений другого
14.
Формы представления сгруппированныхданных
Текст
Таблица
График
15.
Принципы конструирования таблиц1) Таблица должна быть небольшой по размеру и легко обозримой
2)
Рекомендуется вводить графу с названием «прочие» или «другие», «до …», «более …»
(не более 10% единиц наблюдения.
3) Таблица обязательно должна иметь номер и заголовок, в котором указывается время,
территория, к которым относятся данные, единицы измерения, если они едины для всей
совокупности.
4) Наименования граф и строк должны быть сформулированы точно, кратко, ясно. Слова в
таблице пишутся полностью, без сокращений.
5) При отсутствии общей единицы измерения в каждой графе или строке проставляются
используемые единицы измерения.
6) В таблицах с большим количеством строк и граф их необходимо нумеровать.
7) К названию таблицы указывается сноска-примечание (в виде звездочки), которая
расположена сразу после завершающей нижней черты таблицы. В ней дается указание на
источник информации. Сноска оформляется в соответствии с общими
библиографическими правилами.
8) Могут быть ссылки к части таблицы. Они нумеруются и раскрывается над нижней чертой
таблицы. Такие сноски обычно нужны для того, чтобы указать на обстоятельства, которые
нужно иметь в виду при чтении таблицы.
16.
Принципы конструирования таблиц9) При заполнении таблицы используются условные обозначения:
• - при отсутствии явления ставится “–“;
• - если нет информации указывается «нет сведений»;
• - если изучаемое явление не имеет осмысленного содержания, то ставится “x”;
• - при наличии информации по изучаемому объекту или явлению, числовое значение
которого составляет величину меньшей принятой в таблице точности, принято записывать
«0»;
• - если есть сомнение в данных, приведенных в таблице, то рядом с показателем
ставится «!»;
• - если данные приближенные, то они заключаются в скобочки.
10 ) При заполнении таблицы нужно соблюдать одинаковую степень точности, т.е. все
показатели должны быть либо целыми, либо десятичными с одинаковым числом цифр после
запятой. Наиболее распространенная степень точности – одна цифра после запятой.
11) Рекомендуется в таблице использовать итоговые показатели, такие как «ИТОГО» отмечает итог к части таблицы; «ВСЕГО» - итог ко всей таблице.
12) Таблица должна быть обязательно проанализирована в тексте по схеме «от общего – к
частному».
17.
График - это• Чертеж, выполненный в определенной системе координат, на
котором с помощью графических изображений отражаются
статистические показатели
• Свойства:
- Наглядность
- Аналитичность
18.
Структура графика• Поле графика
• Графические образы
• Пространственные ориентиры (прямоугольная система
координат; полярная система координат)
• Масштабные ориентиры (прямолинейная шкала; криволинейная
шкала)
• Экспликация
19.
Виды графиков•Линейный
•Гистограмма (столбиковая
диаграмма)
•Круговая диаграмма
20.
21.
22.
23.
24.
25.
Полигонраспределения
значений
признака
26.
27.
Нормально распределенным• называется такой признак, полигон распределения которого
соответствует плавной симметричной колоколообразной линии с
центром в среднеарифметическом значении
• При изучении общественных явлений к нормально
распределенным относят слегка скошенные распределения
28.
29.
30.
тренд31.
Графический анализсвязи между
признаками