Similar presentations:
Статистические методы обработки данных
1.
МОУ ДОД ДЮЦ «ЕДИНСТВО»статистические
методы
обработки данных
22 слайда
2. Этапы статистического исследования
• 1. Сбор информации• 2. Обработка информации
• 3. Анализ данных
3. Виды статистических признаков:
• количественные;• качественные (атрибутивные,
описательные)
• альтернативные, имеющие только
два значения: да (1) или нет (0).
4. Виды ошибок статистического наблюдения:
• I. Ошибки наблюдения по источникупроисхождения:
• - преднамеренные (тенденциозные);
• - непреднамеренные (случайные);
• - ошибки запамятования;
• - ошибки, связанные с фактором
времени.
• II. Ошибки статистических расчетов.
5. Виды статистического наблюдения
• I. Виды наблюдения по характерурегистрации фактов:
• - текущее (непрерывное);
• - периодическое (прерывное);
• - единовременное (разовое).
• II. Виды наблюдения по степени охвата
единиц изучаемой совокупности:
• - сплошное;
• - несплошное.
6. Разновидности несплошного наблюдения
выборочное
способ основного массива
анкетные обследования
монографическое исследование
7. Таблица оптимальных соотношений объема исследуемой совокупности (n) и числа групп (s)
n15-24
25-44
45-89
s
5
6
7
90-179 180-359 360-719
8
9
10
8. При группировке данных необходимо знать следующее:
• 1. Минимальное и максимальное значение признакав группе называется нижней и верхней границей
интервала.
• 2. Интервалы, в которых указана лишь одна граница,
называются открытыми интервалами.
• 3. Пограничные значения признака всегда
включаются в следующий интервал.
• 4. Ширина открытого интервала равна ширине
прилежащего интервала.
• 5. Все интервалы группировки должны быть
заполнены единицами наблюдения.
• 6. Мелкие группы (менее 10% совокупности) при
группировке могут быть объединены рубрикой
«прочие».
9. Группировки
• 1. Структурные группировки – имеют своейцелью выявление структуры совокупности.
• 2. Типологические группировки – строятся по
качественным признакам, имея своей целью
выявление групп и типов явлений.
• 3. Аналитические группировки – направлены на
выявление взаимосвязи между отдельными
признаками. В основании аналитических группировок
лежит факторный признак x. Признак-следствие y
называется результативным, т.е. результативный
признак – это признак, который изменяется под
влиянием факторного признака (-ов).
10. Построения гистограммы на основе равноинтервальной группировки
109
Количество компаний (частота)
fj
9
8
7
7
6
5
5
4
4
3
2
3
2
1
0
0,99
1,07
1,15
1,23
1,31
1,39
0,95– 1,03
1,03 – 1,11
1,11 – 1,19
1,19 – 1,27
1,27 – 1,35
1,35 – 1,43
x jн - x jв
Годовой доход компании, сотни млн. $
11. Средние величины
xСредняя степенная
x
k
i
k
n
x x2 x3 xn
x 1
n
xj f j
x
fj
Средняя
арифметическая
Средняя
геометрическая
Средняя
квадратическая
x g n k p 1 k p 2 k p n n П k p j
xq 2
2
x
i
n
x
n
i
12. Мода и медиана
• Мода (Мо) – это значение признака,наиболее часто встречающееся в
данной совокупности.
• Медиана (Ме) – значение признака у
единицы, стоящей в середине
ранжированного массива.
13. Виды показателей вариации
1. Абсолютные показатели вариации признака:• Размах вариации (колебаний) R x
x
• Дисперсия признака
σ
2
x
x
i
x
max
2
n
• Среднее квадратическое отклонение
w σ w 1 w
2
w
x σ
2. Относительные показатели вариации:
• Коэффициент вариации
min
σx
V 100%
х
2
x
14. Ошибка репрезентативности состоит из трех компонент:
• - случайная компонента – возникает в томслучае, когда в выборочную совокупность
случайно попадают единицы, существенно
искажающие представление о генеральной
совокупности;
• - систематическая компонента – возникает
при нарушении принципа случайности
отбора;
• - сущностная компонента – связана с
различиями в численности единиц и степени
вариации признака в выборочной и
генеральной совокупности (т.е. с сущностью
выборочного наблюдения).
15. Средняя ошибка репрезентативности
Отборгенерального
среднего
Повторный
σ x2
μх
n
Бесповторный
σ
n
μх
2
x
n
1
N
генеральной
доли
σ w2
μw
n
w 1 w
n
σ w2
n
μw
1
n N
16. Способы отбора в выборочную совокупность
• 1. Собственно случайный отбор(метод жеребьевки или метод лото)
• 2. Механическая выборка
• 3. Типический отбор с механической
выборкой
• 4. Многоступенчатая выборка.
• 5. Многофазная выборка
• 6. Серийная (гнездовая) выборка
17. Ошибка многоступенчатой выборки
μμ
μ
х μ
n1 n1 n2
n1 n2 ... nm 1
2
1
2
2
2
3
2
m
18. Доверительный интервал генерального среднего или генеральной доли
• - расчет границ генерального среднегоX x Δх x tμx
• - расчета границ генеральной доли
W w Δw w tμw
19. Значения коэффициента кратности при различных уровнях доверительной вероятности
Уровеньдоверительной
0,683 0,950 0,954 0,990 0,997 0,999
вероятности
p(t)
Критерий
кратности t
1,00 1,96 2,00 2,58 3,00 4,00
20. Формулы расчета необходимой численности выборки
ОтборДля средней
Повторный
t σ
n
Δx
2
Бесповторный n
Для доли
2
x
2
n
t σ N
2
2
x
Δx N t σ
2
2
2
x
t 2 σ w2
Δw
2
t 2 w 1 w
2
Δw
t 2 w(1 w)N
n 2
Δw N t 2 w(1 w)
21. Связи между явлениями и признаками
• функциональная связь (полная) – определенномузначению факторного признака соответствует одно
или несколько строго определенных значений
результативного признака;
• корреляционная связь (статистическая, неполная)
– одному и тому же значению факторного признака
могут соответствовать разные значения
результативного признака.
• - слабая,
• - умеренная
• - сильная (тесная)
22. Аналитические методы корреляционного анализа
• 1. Метод приведения параллельныхданных
• 2. Метод построения
корреляционных таблиц
• 3. Графический метод
• 4. Дисперсионный анализ