Показатели вариации
Показатели относительного рассеяния
Меры вариации для сгруппированных данных. Правило сложения дисперсий
Вычислим m частных средних
Общая дисперсия отражает вариацию признака за счет всех условий, действующих в совокупности
Межгрупповая дисперсия отражает вариацию между группами за счет фактора, положенного в основу группировки
Частная групповая дисперсия отражает вариацию внутри каждой группы
Внутригрупповая дисперсия - средняя арифметическая из групповых дисперсий
Эмпирическое корреляционное отношение
Группировка населения отдельных областей России по среднему размеру ежемесячных денежных льгот пенсионеров
Вариация альтернативного признака
631.00K
Category: mathematicsmathematics

Показатели вариации

1. Показатели вариации

«Всякая вещь есть форма
проявления
беспредельного
разнообразия»
Козьма Прутков,
Плоды раздумья

2.

План лекции
1. Абсолютные показатели вариации
2. Относительные показатели вариации
3.Меры
вариации для
сгруппированных данных
4.Правило сложения дисперсий
5. Вариация альтернативного признака

3.

Ряд I: 1, 2, 3, 4, 5, 6, 6, 7, 8, 9, 10, 11
Ряд II:
4, 5, 5, 5,6, 6, 6, 6, 7, 7, 7, 8
x 6, Me 6, Mo 6, n 12
x 6, Me 6, Mo 6, n 12

4.

5.

Интерквартильный размах –
разница между первым и
третьим квартилями. Чем
больше величина интерквартильного
размаха, тем больше рассеяние
признака. Интерквартильный размах
в ряду I равен 5.5, интерквартильный
размах в ряду II равен 2.

6.

Размах вариации - разность между
наибольшим и наименьшим
значениями признака
R xmax xmin

7.

x x
n
Сумма отклонений всех вариантов
от их средней арифметической,
согласно
свойству
средней
арифметической, всегда равна нулю.

8.

L
L
x
x
n
x x f
f

9.

x x
2
2
n
2
k
2
x x f
i 1
i
k
f
i 1
i
i

10.

Дисперсия вариационного ряда есть
средняя арифметическая квадрата
отклонения (средний квадрат
отклонения) значений признаков ряда
от их средней арифметической.

11.

Среднее квадратическое (стандартное)
отклонение вариационного ряда есть
арифметическое значение корня
квадратного из дисперсии.
2

12.

Среднее квадратическое
(стандартное) отклонение
вариационного ряда есть
арифметическое значение корня
квадратного из дисперсии.
2

13. Показатели относительного рассеяния

Расчет показателей меры
относительного рассеяния
осуществляют как отношение
абсолютного показателя вариации
признака к средней арифметической,
умножаемое на 100%.

14.

Коэффициент осцилляции отражает
относительную колеблемость крайних
значений признака вокруг средней:
R
К 0 100%
х

15.

Относительное линейное отклонение
характеризует долю усредненного
значения признака абсолютных
отклонений от средней величины:
L
K L 100
x

16.

Коэффициент вариации является
наиболее распространенным
показателем колеблемости,
используемым для оценки типичности
средних величин:
V
x

17.

Предположим, что стандартное отклонение в
выборке валютных счетов в банке «А» и
банке «В» равно $20. Данные по банку «А»
содержат информацию о счетах, сумма
которых находится в пределах $60. В банке
«В» данные содержат информацию
относительно счетов, сумма которых
достигает $1 миллион и больше. В первом
случае стандартное отклонение в 20 единиц
очень велико относительно сумм счетов. Для
суммы порядка $1 миллиона – что значит
вариация плюс-минус $20 относительно
среднего?

18.

Сравнивая эти два случая, можно сказать, что
такая абсолютная мера рассеяния как
стандартное отклонение не передает
существенной информации при сравнении
вариационных рядов. Коэффициент вариации
создан специально как относительная мера
вариации.
Чем меньше значение коэффициента
вариации, тем однороднее совокупность по
изучаемому признаку и типичнее средняя. В
статистике совокупности, имеющие
коэффициент вариации больше 30-35 %,
принято считать неоднородными.

19.

Однако у такого способа оценки вариации
есть и существенный недостаток. Например,
исходная совокупность рабочих, имеющих
средний стаж 15 лет, со средним
квадратическим отклонением = 10 лет,
«состарилась» еще на 15 лет. Теперь = 30 лет,
а среднеквадратическое отклонение попрежнему равно 10. Совокупность, ранее
бывшая неоднородной (10/15 100 = 66,7%),
со временем оказывается, таким образом,
вполне однородной (10/30 100 = 33,3 %).

20. Меры вариации для сгруппированных данных. Правило сложения дисперсий

Вариация признаков, как правило, обусловлена
влиянием
различных
факторов.
Если
совокупность разбить на группы по факторному
признаку, то это окажет определенное влияние
на значение вариации признака в группах.
Выявить долю вариации, определяемую теми или
иными факторами, можно разделяя всю
совокупность на группы по фактору, влияние
которого исследуется.

21.

Для этих целей используются показатели
вариации для сгруппированных данных. В
этом случае выделяют три вида дисперсий:
Общую дисперсию; внутригрупповую
дисперсию, межгрупповую дисперсию.
Общая дисперсия измеряет вариацию признака
во всей совокупности под влиянием всех
факторов. Внутригрупповая дисперсия
измеряет вариацию признака внутри группы, а
межгрупповая дисперсия измеряет вариацию
групповых средних относительно общей
средней.

22.

Значение
признака x
Число
единиц
в j -й
группе
Итого
1
2

m
x1
f1
s1

t1
f1 s1 ... t1 n1
x2
f2
s2

t2
f 2 s2 ... t 2 n2





xk
fk
sk

tk
Итого
N1
N2

Nm

f k sk ... t k nk
N

23. Вычислим m частных средних

x1
k
xi f i
i 1
N1

24.

k
x2
x s
i 1
i i
N2

k
xm
xt
i 1
i i
Nm
.

25.

На основе частных средних
x1 , x2 ,..., xm
определяем общую среднюю
xобщ.
m
xjN j
j 1
N
, где
m
k
N N j ni
j 1
i 1

26. Общая дисперсия отражает вариацию признака за счет всех условий, действующих в совокупности

2
общ.
k
2
xi xобщ. ni
i 1
N

27. Межгрупповая дисперсия отражает вариацию между группами за счет фактора, положенного в основу группировки

x
x
N
m
2
j 1
2
j
N
j

28. Частная групповая дисперсия отражает вариацию внутри каждой группы

k
2
xi x1 f i
2 i 1
1
N1

29.

k
2
xi x2 si
2 i 1
2
N2
…….
k
2
xi xm ti
2 i 1
m
Nm

30.

В общем виде частная дисперсия:
x
x
N
k
2
j
i 1
2
i
j
Nj
где Nij- частоты для значений xi, в
каждой j-группе, j=1,…,m.
ij

31. Внутригрупповая дисперсия - средняя арифметическая из групповых дисперсий

m
2
N
j
j 1
2
j
N

32.

Общая дисперсия равна сумме межгрупповой
дисперсии и средней из внутригрупповых
дисперсий
2
2
2
Суть
правила:
общая
дисперсия,
возникающая
под
воздействием
всех
факторов,
формируется
из
дисперсии,
возникающей за счет фактора группировки и
дисперсии, возникающей под воздействием
всех прочих факторов.

33.

С помощью правила сложения дисперсий
оценивается удельный вес факторов,
лежащих в основе группировки, во всей
совокупности факторов, воздействующих
на результативный признак. Для этого
применяется коэффициент детерминации
2
2
2

34. Эмпирическое корреляционное отношение

2
2

35.

Показатель принимает значения в интервале
[0, 1] и и характеризует взаимосвязь между
изучаемым признаком и признаком, положенным в
основу группировки. Если связь между признаками
отсутствует, то = 0. В этом случае дисперсия
групповых средних равна нулю ( 2 = 0), то есть все
групповые средние равны между собой и
межгрупповой вариации нет. Если связь
функциональная, то =1. В этом случае дисперсия
групповых средних равна общей дисперсии ( 2 =
2), то есть внутригрупповая дисперсия
отсутствует. Это означает, что группировочный
признак полностью определяет вариацию
изучаемого признака, а влияние прочих факторных

36.

Промежуточные значения оцениваются по
степени их близости к граничным
Качественная оценка связи между признаками
(шкала Чеддока)
0
0-0,2
0,2-0,3
0,3-0,5
Связь
Отсутствует
Очень слабая
Слабая
Умеренная
0,5-0,7
0,7-0,9
0,9-0,99
1
Связь
Заметная
Тесная
Весьма тесная
Функциональная

37. Группировка населения отдельных областей России по среднему размеру ежемесячных денежных льгот пенсионеров

Место
проживания
Средний
размер
денежных
льгот, руб.
Численность
пенсионеров,
тыс.чел.
Nj
xj
Дисперсия
льгот в
области
(группе)
2j
Курская обл.
Курганская
обл.
Камчатская
обл.
264,3
341,4
9025
310,4
235,5
2704
490,4
38,9
2116
Итого
296,2
615,8
7171,2

38.

Найдем средний размер льгот (руб.) по трем
областям в целом:
x N 264,3 341,4 310,4 235,5 490,4 38,9
x
296,2
615,8
N
j
j
j
j
j

39.

Вариация льгот по отдельным областям,
обусловленная различием в месте проживания
пенсионеров, характеризуется межгрупповой
дисперсией:
x x N 264,3 296,2 341,4 310,4 296,2 235,5
m
2
j 1
2
j
j
2
N
615,8
490,4 296,2 38,9
3023,6 руб.2
2
615,8
2

40.

Средняя из групповых дисперсий дает обобщающую
характеристику случайной вариации, обусловленную
отдельными факторами, кроме места проживания
пенсионеров (например, характером занятости,
стажем работы и т.п.):
9025 341,4 2704 235,5 2116 38,9
2
6171,2 руб.
615,8
2

41.

Вариация льгот в изучаемых областях
России, обусловленная влиянием всех
факторов, вместе взятых, определяется
общей дисперсией:
2976,1 6171,2 9147 ,3
2
2
2

42.

2
2
2
общ.
2976 ,1
0,325
9147 ,3

43.

Полученный коэффициент детерминации
показывает, что дисперсия льгот зависит от
места проживания пенсионеров на 32,5 %.
Остальные 67,5% определяются другими
неучтенными факторами.
0,325 0,57
2
Полученное значение эмпирического
корреляционного отношения позволяет
утверждать, что существует заметная связь
между местом проживания пенсионеров и
размером льгот.

44. Вариация альтернативного признака

При статистическом выражении
колеблемости альтернативных признаков
наличие изучаемого признака
обозначается 1, а его отсутствие – 0. Доля
вариантов, обладающих изучаемым
признаком обозначается р, а доля
вариантов, не обладающих признаком q.
Следовательно, р + q=1.

45.

х
w
1
p
0
q

46.

x f 1 p 0 q
x
p
p q
f
i
i
i
i
i

47.

( x x ) f (1 p) p (0 p) q
q p p q pq( p q) pq
p q
f
2
i
2
p
i
2
2
2
i
i
i
2

48.

Если значения 1 и 0 встречаются одинаково
часто, то дисперсия достигает своего
максимума
Пример. На 10000 населения приходится
4000 мужчин и 6000 женщин. Определить
среднее квадратическое отклонение по полу.
Решение. Доля мужчин в населении
p=4000/10000=0,4; доля женщин
q=6000/10000=0,6. Тогда дисперсия
pq 0,4 0,6 0,24
2
p
а среднее квадратическое отклонение
p 0, 24 0, 49
2
p

49.

Внутригрупповая дисперсия доли
2
pi pi (1 pi )
Средняя из внутригрупповых дисперсий
2
pi
pi (1 pi )ni p (1 p )
i
i
ni

50.

межгрупповая дисперсия
(
p
p
)
n
2
i
i
pi
ni
2

51.

где ni – численность единиц в отдельных
группах;
p – доля изучаемого признака во всей
совокупности, которая определяется по
формуле:
pi ni
p
ni

52.

Общая дисперсия
p(1 p)
2
p
Правило сложения дисперсии доли признака
2
2
2
p pi pi

53.

Цех
Удельный
Численность
вес основных всех рабочих
рабочих в % (чел.)
(pi)
1
80
100
2
75
200
3
90
150
Итого
-
450

54.

Определим долю рабочих в целом по
фирме:
0,80 100 0, 75 200 0,90 150 365
p
450
450
0,81

55.

Общая дисперсия доли
основных рабочих по всей
фирме в целом будет равна:
2
р 0,81 1 0,81 0,154

56.

Внутрицеховые дисперсии:
2
p1 0,8 0,2 0,16;
2
p 2 0,75 0,25 0,19;
2
p3 0,9 0,1 0,09.

57.

Средняя из внутрицеховых дисперсий:
0,16 100 0,19 200 0,09 150 675
2
pi
0,15
450
450
Межгрупповая дисперсия:
0,8 0,81 100 0,75 0,81 200 0,9 0,81 150
2
2
pi
365
0,004
450
2
450
2

58.

0,154 = 0,15 + 0,004
English     Русский Rules