Similar presentations:
Статистические оценки параметров распределения. Доверительные интервалы
1. Статистические оценки параметров распределения
Доверительныеинтервалы
2.
1. Виды статистических ошибок2. Интервальные оценки
3. Доверительные интервалы
3. Виды статистических ошибок
Def:Статистической оценкой неизвестного
параметра теоретического распределения
называют функцию от наблюдаемых
случайных величин.
Для того, чтобы статистические оценки давали
«хорошие» приближения оцениваемых
параметров, они должны удовлетворять
определенным требованиям.
4.
Def:Несмещенной называют статистическую
оценку Θ*, математическое ожидание которой
равно оцениваемому параметру Θ при любом
объеме выборки, т.е. M(Θ*) = Θ.
Смещенной, если M(Θ*) ≠ Θ.
Def:
Эффективной называют статистическую
оценку, которая (при заданном объеме выборки
n) имеет наименьшую возможную дисперсию.
5.
Def:Состоятельной называют статистическую
оценку, которая при n→∞ стремится по
вероятности к оцениваемому параметру.
Оценки бывают точечными, которые
определяются одним числом. Все оценки,
рассмотренные выше – точечные.
6. Точечные оценки
SxSx
;
mx
; mS
2(n 1)
n 1
x
M Cv
Cv
2n
7.
При выборке малого объема точечная оценкаможет разительно отличаться от
оцениваемого параметра, т.е. приводить к
грубым ошибкам.
По этой причине при небольшом объеме выборки
следует пользоваться интервальными
оценками.
8. Интервальные оценки
Интервальные оценки позволяют установитьточность и надежность оценок.
Пусть найденная по данным выборки
статистическая характеристика Θ* служит
оценкой неизвестного параметра Θ.
Если δ > 0 и │Θ – Θ*│< δ, то чем меньше δ,
тем оценка точнее.
9.
Т.о., положительное число δ характеризуетточность оценки.
Однако статистические методы не позволяют
категорически утверждать, что оценка Θ*
удовлетворяет неравенству │Θ – Θ*│< δ;
можно лишь говорить о вероятности γ, с
которой это неравенство осуществляется.
10.
Def:Надежностью (доверительной вероятностью)
оценки Θ по Θ* называют вероятность γ, с
которой осуществляется неравенство
│Θ – Θ*│< δ. γ = 0,95; 0,99; 0,999.
P
*
11.
Заменив неравенство │Θ – Θ*│< δравносильным уме двойным неравенством
- < - <
*
*
*
P
*
*
Вероятность того, что интервал
(Θ* - δ; Θ* + δ) заключает в себе (покрывает)
неизвестный параметр Θ, равна γ.
12. Доверительный интервал
Def:Доверительным интервалом называется
случайный интервал (Q* - δ; O* + δ), в пределах
которого с вероятностью γ находится
неизвестный оцениваемый параметр.
Доверительные интервалы находят по
различным формулам, в зависимости от
исходных данных.
13.
Доверительный интервал для математическогоожидания нормально распределенного признака
с известным средним квадратическим
отклонением находят по формуле:
t ( X )
t ( X )
p( xв
M ( X ) xв
) 2 (t ),
n
n
(X )
где
среднее
квадратическое
отклонение,
n
t – параметр, величину которого находят по
таблицам Лапласа из соотношения γ=2Φ(t).
14.
Приведенная формула позволяет решатьследующие задачи:
1) По заданным надежности γ и объеме выборки
n находить точность δ и доверительный
интервал.
2) По заданным надежности γ и точности δ
находить объем выборки n.
3) По заданным точности δ и объеме выборки n
находить надежность γ.
15.
В случае большой выборки при n > 30 инеизвестном среднем квадратическом
отклонении σ(X) доверительный интервал
находят по формуле:
tS
tS
xв
M ( X ) xв
n
n
где S – исправленное выборочное среднее
квадратическое отклонение, то есть оценка
σ(X).
16.
Исследование большой выборки можетоказаться невозможным по различным
признакам. Кроме этого, с уменьшением n
доверительный интервал увеличивается.
При определении доверительного интервала в
случае нормального распределения при
неизвестном σ признака X в генеральной
совокупности применяют случайную величину:
17.
xв M ( X )T
n
S
Эта величина соответствует закону t –
распределения Стьюдента.
Дифференциальная функция распределения T
обозначается S(tγ; n) и зависит только от
объема выборки n.
18.
Вероятность попадания случайной величины всоответствующий интервал равна:
t
P(| T | t ) 2 S (t ; n)dt (t ; n).
0
19.
Доверительный интервал для оценкиматематического ожидания при неизвестном σ.
S
S
x в t
M ( X ) x в t
,
n
n
где tγ = t(γ; n) – числа, приведенные в
специальных таблицах.
20.
Примечание: при большом объеме выборки(n ≥ 30) значения tγ таблицы Стьюдента и
t таблицы Лапласа практически равны.
Поэтому выбор формулы, по которой
определяют доверительный интервал,
диктуется исходными данными.
21. Пример
Для определения средней живой массытрехмесячного теленка определенной породы
были взвешены 100 животных и результаты
сведены в таблицу
Масса, 23-25 25-27 27-29 29-31 31-33 33-35 35-37
кг
Число
телят,
гол
3
10
6
16
15
30
20
22.
Найти:1) величины, которые следует принять за
среднюю массу и среднее квадратическое
отклонение;
2) ошибку средней и коэффициетнт вариаций;
3) доверительный интервал, в котором с
вероятностью 0,95 заключена средняя масса.
23. Решение
1) В качестве приближенного значения среднеймассы принимаем выборочную среднюю, а за
значение признака – середины интервалов
24 3 26 10 28 6 30 16 32 15 34 30 36 20
xв
32кг.
100
24.
Вычисляем выборочную исправленнуюдисперсию
1
2
2
2
2
S (3(24 32) 10(26 32) 6(28 32) 16(30 32)
99
2
2
2
15(32 32) 30(34 32) 20(36 32) 11,62.
2
25.
Находим исправленное выборочное среднееквадратичное отклонение
100
S
11, 62 3, 45кг.
99
26.
2) Ошибка средней равна3, 45
x
0,345кг
100
Коэффициент вариации
3, 45
V
100 10, 78%
32
показывает, что изменчивость признака
средняя.
27.
3) Поскольку n = 100 > 30 и у нас случайнормального распределения, то доверительный
интервал находим по формуле
tS
tS
xв
M ( X ) xв
n
n
28.
Из условия 2Φ(tγ) = 0.95 определяемΦ(tγ) = 0,475, а по таблице приложений
находим tγ = 1,96.
Поэтому
1,96 3, 45
1,96 3, 45
32
x 32
100
100
или 31,32 < x < 32,68 кг – доверительный
интервал для заданной вероятности.
29.
Замечание: если требуется оценитьматематическое ожидание с наперед заданной
точностью δ и надежностью γ, то
максимальный объем выборки, который
обеспечит эту точность, находится по
формуле
n t
2
S
2
2
(n
)
30.
Объем выборочной совокупности при повторномспособе отбора находят по формуле:
n
2
2
t S (X )
2
,
(t )
где параметр t определяют из
по таблицам Лапласа;
tS x
n
.
2
31. Доверительный интервал для оценки среднего квадратического отклонения σ нормального распределения.
P SS S
S (1 ) S (1 )
S
S
32.
Sq
S (1 q) S (1 q)
q находят по приложению №4 руководства
Гмурмана В.С.