Similar presentations:
Статистические оценки параметров распределения
1.
Министерство образования и науки Российской ФедерацииФедеральное государственное бюджетное образовательное
учреждение высшего образования
Российский химико-технологический университет
имени Д.И. Менделеева
______________________________________
ТЕМА 6:
Статистические оценки
параметров распределения
2018 г.
2.
Точечные оценки параметров распределенияТочечной статистической оценкой параметра
распределения а (математического ожидания, дисперсии
или среднеквадратического отклонения) называется
приближенное значение а*этого параметра, вычисленное по
данным выборки. Оценка а* является случайной величиной,
и по конкретной выборке мы вычисляем ее наблюдаемое
значение.
Требования, предъявляемые к оценкам
• Несмещенной называется точечная статистическая
оценка, математическое ожидание которой равно
оцениваемому параметру.
• Состоятельной называется точечная статистическая
оценка, которая при увеличении объема выборки стремится
по вероятности к оцениваемому параметру.
• Эффективной называется точечная статистическая
оценка, которая имеет наименьшую дисперсию при данном
2
объеме выборки.
3.
Оценка генеральной средней по выборочнойсредней.
Генеральной средней называется математическое
ожидание изучаемого признака
Выборочной средней хв называется среднее
арифметическое значение наблюдаемых в выборке
значений признака (xi ). Выборочное среднее вычисляется
по формулам:
1. Если выборочные данные не сгруппированы или в
1
выборке нет одинаковых вариант хв ( х1 х2 хn ) .
n
1
2. По сгруппированным данным хв ( х1m1 х2 m2 хk mk )
n
1 k
или хв xi mi .
п i 1
Выборочная средняя является несмещенной и
состоятельной оценкой генеральной средней
3
4.
Оценка генеральной дисперсии поисправленной выборочной дисперсии.
Генеральной дисперсией называется дисперсия
изучаемого признака
Выборочной дисперсией Dв называется среднее
арифметическое квадратов отклонений наблюдаемых
значений признака от выборочного среднего.
1
Dв (( x1 xв ) 2 m1 ( x 2 xв ) 2 m2 ( x k xв ) 2 mk )
n
k
Dв mi ( xi x) 2
или
i 1
При расчетах удобно пользоваться формулой
1 2
Dв ( x1 m1 x 22 m2 x k2 mk ) ( xв ) 2
n
или
1 k 2
2
Dв xi тi xв
п i 1
4
5.
Выборочная дисперсия является смещенной оценкойгенеральной дисперсии D(Х). Можно доказать, что
n 1
M ( Dв )
D ( X ).
n
Несмещенной оценкой генеральной дисперсии
является исправленная выборочная дисперсия s2,
которую вычисляют по формуле
n
s
Dв .
n 1
2
При расчетах можно воспользоваться любой из формул:
k
1
2
s
m
(
x
x
)
i i
n 1 i 1
2
или
k
2
1
2
2
или s n 1 mi xi n x
i 1
1
s
(( x12 m1 x22 m2 xk2 mk ) n ( xв ) 2 )
n 1
2
5
6.
Выборочная дисперсия Dв и исправленная выборочнаядисперсия s2 обладают свойством состоятельности. Оценка
s2 не обладает свойством эффективности, но обладает
свойством несмещенности, поэтому ее чаще чем Dв
используют в качестве приближенного значения дисперсии
D(Х).
Оценкой среднеквадратического отклонения признака
σ(х) является исправленное среднеквадратическое
отклонение s.
s s2
Оценкой вероятности события А является
относительная частота события А, найденная серии
из n независимых испытаний :
*
m
p
n
где m – число появления события А в n испытаниях.
Эта оценка обладает свойствами несмещенности,
6
состоятельности и эффективности.
7.
Пример 3. Найти статистические оценки параметровраспределения по выборке
xi
2,1
2,5
2,7
3
3,1
mi
2
3
5
4
1
Решение. Объем выборки n=15.
1
40,3
хв (2,1 2 2,5 3 2,7 5 3 4 3,1 1)
2,6867
15
15
1
(2,12 2 2,52 3 2,7 2 5 32 4 3,12 1) (2,6867)2
15
109,63
7,2184 0,0903
15
15
s 2 0,0903 0,0968
14
7
Dв
8.
Если выборка большого объема, а варианты представленычислами неудобного формата, то для упрощения расчета
статистических точечных оценок параметров распределения
можно воспользоваться методом условных вариант по
следующему алгоритму.
1. Составить интервальный статистический ряд, выбрав
интервалы одинаковой длины.
2. Заменить его дискретным статистическим рядом, где в
качестве вариант взять середины соответствующих
интервалов (получится последовательность равноотстоящих
вариант).
3. Перейти к условным вариантам по формуле
xi c
,
ui
h
где h – шаг между равноотстоящими вариантами (он равен
длине частичного интервала);
c – так называемый «ложный» нуль (варианта, имеющая
наибольшую частоту). При этом условные варианты будут 8
целыми числами.
9.
4. Произвести расчет точечных оценок параметров поформулам:
1 k
ui тi ;
а) найти условное выборочное среднее и
п
i 1
б) найти условную выборочную дисперсию
k
1 k
1
Dв (и ) тi (ui u ) 2 или Dв (и ) тi ui2 (u ) 2
п i 1
п i 1
;
в) найти исправленную условную выборочную дисперсию
n
2
s
D (и ) ;
u
n 1
в
г) вернуться к исходным вариантам
Dв h Dв (и); s h s ;
2
2
x
2
2
u
хв и h c
sx s .
2
x
9
10.
Интервальной называют оценку, которая определяетсядвумя числами – концами интервала. Она позволяет
установить точность и надежность оценки.
Пусть по данным выборки найдена точечная статистическая
оценка a* параметра распределения изучаемого признака a
Точностью оценки называется такое положительное
*
число ε что
a a (1)
Чем меньше ε, тем выше точность. Поскольку a –
неизвестное постоянное число, а оценка a* - случайная
величина, статистические методы позволяют говорить лишь
о вероятности, с которой осуществляется неравенство (1).
Доверительной вероятностью (надежностью) оценки
a* называется вероятность γ, с которой осуществляется
неравенство (1).
*
P a a
10
11.
Доверительным интервалом называют интервалвида
*
*
,
а
; а
который покрывает неизвестный параметр а с
заданной надежностью γ.
Его случайные концы а*-ε; а*+ε называют
доверительными границами.
Обычно, задают надежность γ (вероятность близкая
к единице). По ней вычисляют число ε, зависящее от
γ. По статистической оценке a* и найденному ε
строят интервал, который с вероятностью γ
заключает в себе (покрывает) неизвестный
11
параметр а.
12.
Доверительный интервал для оценки математическогоожидания нормально распределенного признака
генеральной совокупности Х при известном σ
Интервальной оценкой математического ожидания m
нормально распределенного признака генеральной совокупности
Х при известном среднеквадратическом отклонении σ
называется интервал
t
;
х
n
t
x
n
где х – точечная несмещенная оценка математического
ожидания (выборочное среднее);
n – объем выборки; число t находится из уравнения
Ф (t )
2
где γ– заданная доверительная вероятность, с помощью
таблицы значений функции Лапласа.
12
13.
Доверительный интервал для оценки математическогоожидания нормально распределенного признака
генеральной совокупности Х при неизвестном σ
Интервальной оценкой математического ожидания m
нормально распределенного признака генеральной
совокупности Х при неизвестном среднеквадратическом
отклонении σ называется интервал
t s
х
;
n
t s
x
n
где γ – заданная доверительная вероятность;
х – точечная несмещенная оценка математического
ожидания (выборочная средняя);
n – объем выборки;
число tγ находится в зависимости от γ и n с помощью
специальных таблиц.
13
14.
Доверительный интервал для оценкисреднеквадратического отклонения нормально
распределенного признака генеральной совокупности Х
Для построения доверительного интервала для оценки
неизвестного среднеквадратического отклонения нормально
распределенного признака Х используют случайную величину
s n 1 , которая распределена по закону «хи».
С помощью этого распределения вычислены, в зависимости от
γ и n, значения числа qγ.
Эти значения можно найти в соответствующей таблице.
В зависимости от qγ интервальной оценкой
среднеквадратического отклонения σ нормально
распределенного признака генеральной совокупности Х
называется интервал:
s 1 q ; s 1 q
0; s 1 q
q 1
если q 1
если
14