Similar presentations:
Статистические оценки
1. Лекция №3 § 2. СТАТИСТИЧЕСКИЕ ОЦЕНКИ
2.
• Одной из центральных задачматематической статистики является задача
оценивания теоретического распределения
случайной величины на основе выборочных
данных.
• При этом часто предполагается, что вид
закона распределения генеральной
совокупности известен, но неизвестны
параметры этого распределения, такие как
математическое ожидание, дисперсия.
Требуется найти приближенные значения
этих параметров, то есть получить
статистические оценки указанных
параметров.
3.
• Определение.Статистической оценкой
параметра теоретического
распределения называют его
приближенное значение,
зависящее от данных выбора.
4.
• Рассматривая выборочные значения x1 , x2 , , xnкак реализации случайных величин X 1 , X 2 , , X n
получивших конкретные значения в
результате опытов, можно представить
оценку как функцию этих случайных
величин: X 1 , X 2 , , X n Это означает, что
оценка тоже является случайной величиной.
Если для оценки взять несколько k
выборок, то получим столько же случайных
оценок 1 , 2 , , k
Если число наблюдений невелико, то
замена неизвестного параметра оценкой
приводит к ошибке, которая тем больше, чем
меньше число опытов.
5. 2.1. Точечные оценки
• Статистические оценки могут бытьточечными и интервальными.
• Точечные оценки представляют собой
число или точку на числовой оси.
Чтобы оценка была близка к
значению параметра , она должна
обладать свойствами состоятельности,
несмещенности и эффективности.
6. Состоятельность
• Определение. Оценка параметраназывается состоятельной, если она
сходится по вероятности к оцениваемому
параметру, то есть для любого :0
lim P 1
n
Поясним смысл этого равенства:
• Пусть - очень малое положительное число.
Тогда данное равенство означает, что чем
больше объем выборки n, тем ближе оценка
приближается к оцениваемому параметру .
7.
Свойство состоятельности нужнопроверять в первую очередь. Оно
обязательно для любого правила
оценивания. Несостоятельные
оценки не используются.
8. Несмещённость
• Определение. Оценка параметраназывается несмещенной, если M , то
есть математическое ожидание оценки равно
оцениваемому параметру. Если M , то
оценка называется смещенной.
• Это свойство оценки желательно, но не
обязательно. Часто полученная оценка
бывает смещенной, но ее можно поправить
так, чтобы она стала несмещенной.
• Иногда, оценка бывает асимптотически
несмещенной , то есть M .
• Требования несмещенности особенно важно
при малом числе опытов.
9. Эффективность
• Определение. Несмещенная оценкапараметра называется эффективной,
если она среди всех несмещенных
оценок, в определенном классе оценок
данного параметра, обладает
наименьшей дисперсией.
10.
• Можно показать, что:• - xв является состоятельной,
несмещенной и эффективной оценкой M X
в классе линейных оценок;
• - Dвявляется состоятельной, смещенной
оценкой D X ;
n
2
S
Dвявляется состоятельной,
• n 1
несмещенной оценкой D X ;
2
(при больших n разница между S и Dв
мала.
2
S используется при малых выборках,
обычно приn 30 ) ;
11.
nAn
• - относительная частота появления
события A в n независимых
испытаниях является состоятельной,
несмещенной и эффективной оценкой,
в классе линейных оценок,
неизвестной вероятности p P A ( p вероятность появления события A в
каждом испытании);
• - эмпирическая функция
*
F
распределения выборки x является
состоятельной, несмещенной оценкой
функции распределения F x случайной
величины X .
12.
• Для нахождения оценок неизвестныхпараметров используют различные
методы. Наиболее
распространенными являются: метод
моментов, метод максимального
правдоподобия (ММП), метод
наименьших квадратов (МНК).
13. 2.2. Интервальные оценки
• При выборке малого объема точечная оценкаможет существенно отличаться от
оцениваемого параметра. В этом случае
целесообразно использовать интервальные
оценки.
• Определение. Интервальной называют
оценку, которая определяется двумя числами
– концами интервала.
14.
• Пусть найденная по данным выборкивеличина служит оценкой
неизвестного параметра . Оценка
определяет тем точнее, чем меньше
то есть чем меньше в неравенстве
0
• Поскольку - случайная величина, то и
разность - случайная величина.
Поэтому неравенство , при
заданном может выполняться только
с некоторой вероятностью.
15.
• Определение. Доверительнойвероятностью ( надежностью) оценки
параметра называется вероятность , с
которой выполняется неравенство .
• Обычно задается надежность и
определяется . Чаще всего надежность
задается значениями от 0,95 и выше, в
зависимости от конкретно решаемой
задачи.
16.
• Неравенство можно записать• Определение. Доверительным
интервалом называется интервал ;
который покрывает неизвестный параметр
с заданной надежностью .
17. 2.2.1. Доверительный интервал для оценки математического ожидания нормального распределения при известной дисперсии
• Пусть случайная величина X имеетнормальное распределение: N a; .
• Известно значение и задана
доверительная вероятность
(надежность) . Требуется построить
доверительный интервал для
параметра aпо выборочному среднему xв
.
18.
• Чтобы подчеркнуть случайный характер xвобозначим его X в.
• Примем без доказательства, что если
случайная величина X распределена
нормально, то и выборочное среднее X в ,
найденное по независимым X в
наблюдениям, также распределено M X в a
нормально.
• Параметры распределения таковы:
X в
n
19.
• Из теории вероятности известнаформула для нормально распределенной
случайной величины X :
,
P X a 2
2
t
x
e 2
1
• где x
dt - функция Лапласа,
2 0
значение которой в точке находим по
таблице (Приложение 2).
20.
• Учитывая, что X в имеет нормальноераспределение можно записать
n
• P X в a 2 или
2 t
X
2
в
n
• Где t
• Из последнего равенства по таблице Лапласа
находим t (Приложение 2).
• Тогда t и доверительный интервал
n
; Xв t
Xв t
покрывает
n
n
с надежностью
математическое ожидание a.
21.
• Пример 6. Случайная величина имеет нормальноераспределение с известным средним квадратическим
отклонением 3. Найти доверительный интервал оценки
неизвестного математического ожидания по выборочной
средней xв , если объем выборки n 36
, а надежность
оценки 0,95 .
• 1. Находим t : 2Ф(t) = 0,95 Ф(t) = 0,475 По таблице
значений функции Лапласа t = 1,96 .
• 2. Определяем t 1,96 3 0 ,98
n
36
• Доверительный интервал запишется в виде: xв 0,98; xв 0,98
22. 2.2.2. Доверительный интервал для оценки математического ожидания при неизвестной дисперсии
• Пусть случайная величина Х имеетнормальное распределение: N a; ,
причем - неизвестно, - задана.
• Если D X неизвестна, то пользуются
оценкой S 2 .
23.
Xв aT
S
n
• Введем случайную величину
• где S - исправленное среднее
квадратическое отклонение случайной
величины X , вычисленное по выборке:
S
1 n
Xi Xв
n 1 i 1
2
;
24.
• Случайная величина Т имеет распределениеСтьюдента с (n -1) степенью свободы.
Тогда доверительный интервал для
оценки a=M(X) имеет вид:
S
S
•
,
; Xв t j
Xв t j
n
n
• где X в - выборочное среднее;
• S - исправленное среднее квадратическое
отклонение;
• t j - находим по таблице квантилей
распределения Стьюдента
(Приложение 3) в зависимости от числа
степеней свободы и доверительной
вероятности .
25.
Пример 7. Произведено пятьнезависимых наблюдений над
случайной величиной X ~ N a; .
Результаты наблюдений таковы:
• x1 35 , x2 20 , x3 15 ,x4 12 , x5 42 .
• Построить для неизвестного M(x)=a
доверительный интервал, если 0,95
.
26.
• 1. Находимxв :
xв
1
35 20 15 12 42 1 30 6
5
5
xв 6
2
S
• 2. Находим :
1
S 2 35 6 2 20 6 2 15 6 2 12 6 2 42 6 2
4
1
41 2 16 2 92 18 2 36 2 1 1681 256 81 324 1296
4
4
1
3638 909 ,5
4
S 909 ,5 30 ,2
27.
• По таблице квантилей распределенияСтьюдента (Приложение 3) для
• 0,95 и n 1 4
• находим : t
t j 2,78
j
• Доверительный интервал:
30,2
30,2 или 31,5; 43,5
; 6 2,78
6 2,78
2,24
2,24
28. 2.2.3. Доверительный интервал для оценки среднего квадратического отклонения нормального распределения
• 1. Если M(x)=a неизвестно, тодоверительный интервал для оценки X
имеет вид: n 1 S n 1 S
2
;
1
• где n - объем выборки; S - исправленное
среднее квадратическое отклонение:
1 n
S
Xi Xв
n 1 i 1
2
2
29.
12 1222 12
2
; n 1 ,
; n 1 - квантили
2
2
2
распределения, определяемые по ,k
таблице (Приложение 5)
• при k n 1 и 1 , 1 .
2
2
30.
• Пример 8. Для оценки параметра Xнормально распределенной случайной
величины была сделана выборка
объема в 25 единиц и вычислено S 0,8.
• Найти доверительный интервал,
покрывающий с вероятностью 0,95.
• Имеем n 25, 0,95.
12 12 0 ,95
2
22 12 0,95
2
; 25 1
;25 1
2 0,975; 24 12 ,4
2 0,025; 24 39,4
• Доверительный интервал имеет вид:
24 0 ,8
24 0 ,8
;
• 39,4 12,4 или (0.62;1.11)
31.
• 2. Другой вид доверительногоинтервала для оценки X нормального
распределения имеет вид:
• S 1 q S 1 q при q 1 ;
• 0 S 1 q при q 1 ;
• где S- исправленное среднее
квадратическое отклонение;
• q q ; n находим по таблице значений
(Приложение 4).
32.
• Пример 9. Для оценки параметранормально распределенной случайной
величины была сделана выборка
объема в 25 единиц и вычислено S 0,8.
• Найти доверительный интервал,
покрывающий с вероятностью 0,95 .
33.
• Имеем n 25 , 0,95 , S 0,8• По таблице значений q q ; n находим
q 0,32
.
• Доверительный интервал имеет вид:
0,8 1 0,32 ; 0,8 1 0,32
или
0,544; 1,056
Замечание. Доверительные интервалы в
примерах 8 и 9 получили разные при
одинаковых данных, но они с
вероятностью 0,95 покрывают
среднее квадратическое отклонение X