Similar presentations:
Интервальные оценки параметров распределения
1.
2.
Пусть имеется некоторая генеральная совокупность, каждыйобъект которой наделён количественным признаком X.
При случайном извлечении объекта из генеральной
совокупности становится извлеченным значение x признака
X этого объекта. Таким образом, можно рассматривать
извлечение объекта из генеральной совокупности как
испытание, X – как случайную величину,
а x – как одно из возможных значений X.
Допустим, что из теоретических соображений удалось
установить, к какому типу распределений относится признак X.
Естественно, возникает задача оценки (приближенного
нахождения) параметров, которыми определяется
это распределение.
Обычно в распоряжении имеются лишь данные выборки
генеральной совокупности, например, значения
количественного признака x1, x2, …, xn, полученные в
результате n наблюдений. Через эти данные и
выражается оцениваемый параметр.
3.
Опытные значения признака X можно рассматривать и какзначения разных СВ X1, X2, …, Xn с тем же распределением, что
и X, и, следовательно, с теми же числовыми характеристиками,
которые имеет X. Значит, M ( X i ) M ( X ) и D ( X i ) D ( X ).
Величины X1, X2, …, Xn можно считать независимыми в силу
независимости наблюдений.
Систему СВ X1, X2, …, Xn называют выборкой.
Функцию f(X1, X2, …, Xn) от наблюдаемых СВ X1, X2, …, Xn
называют статистикой. Статистической оценкой n
неизвестного параметра теоретического распределения
называют статистику, значения которой близки к .
Точечной называется статистическая оценка, которая
определяется одним числом n f x1 , x2 ,..., xn ,
где x1, x2, …, xn – результаты n наблюдений над
количественным признаком (выборка).
4.
К оценке n предъявляются следующие требования.1. M ( n ) .
Оценка, удовлетворяющая такому условию,
называется несмещенной.
2. Для любого ε 0
lim P( θ n θ ε ) 1.
n
Оценку, обладающую такими свойствами, называют
состоятельной.
Если m – неизвестное математическое ожидание СВ X,
то в качестве оценки m применяется
n
1
xi .
выборочная средняя xB , равная xB
n i 1
Выборочная средняя x B является
несмещенной и состоятельной оценкой m.
Если же значения признака x1, x2, …, xk имеют
соответственно частоты n1, n2, …, nk, причём
k
1
ni xi .
n1 + n2 + … + nk = n, то xB
n i 1
5.
Отметим, что если варианты xi – большие числа, то дляупрощения вычисления выборочной средней применяют
следующий приём. Пусть C – константа. Так как
n
n
n
1
xi
( xi C ) nC , то xB C
( xi C ).
n i 1
i 1
i 1
Константу C (ложный нуль) берут такой, чтобы
разности (xi – C) были небольшими.
В качестве оценки неизвестной дисперсии D СВ X
n
1
( xi xB )2 .
применяется выборочная дисперсия: DB
n i 1
Выборочная дисперсия DB является состоятельной,
но смещенной оценкой дисперсии D.
Несмещенной и состоятельной оценкой D является
исправленная выборочная дисперсия:
n
n
1
S2
DB
( xi xB ) 2 .
n 1
n 1 i 1
6.
При малом объёме выборки n 30 пользуютсяисправленной выборочной дисперсией S2;
при больших n n 30 практически безразлично,
какой из двух оценок (DB или S2) пользоваться.
Если значения признака x1, x2, …, xk имеют частоты
n1, n2, …, nk, причём n1 n2 ... nk n, то
k
1
DB
( xi xB ) 2 ni . Более удобна формула:
n i 1
D x x
2
ni xi
.
B
n
n
Если варианты xi – большие числа, то для упрощения
вычисления выборочной дисперсии DB формулу
2
2
ni xi2
n
1
DB
( xi xB ) 2 приводят к следующему виду:
n i 1
n
1
DB
( xi C ) 2 ( xB C ) 2 , где C – ложный нуль.
n i 1
7.
Выборочным средним квадратическим отклонениемназывается корень из выборочной дисперсии: B DB .
Обычным эмпирическим моментом порядка k
называют среднее значение k -х степеней разностей xi C :
M k
ni ( xi C ) k
, где
n – объём выборки;
i
n
ni – частота варианты; xi – наблюдаемая варианта;
C – произвольное постоянное число (ложный нуль).
Начальным эмпирическим моментом порядка k
называют обычный момент порядка k при C 0:
Mk
ni xi k
. В частности, M1 x B .
n
Центральным эмпирическим моментом порядка k
называют обычный момент порядка k при C x B :
mk
ni ( xi x B ) k
n
. В частности, m2 DB .
8.
Метод моментов точечной оценки неизвестныхпараметров заданного распределения состоит в приравнивании
теоретических моментов соответствующим эмпирическим
моментам того же порядка.
Если распределение определяется одним параметром, то для
его отыскания приравнивают один теоретический момент к
одному эмпирическому моменту того же порядка.
Например, можно приравнять начальный теоретический момент
первого порядка к начальному эмпирическому моменту
первого порядка: 1 M 1.
Учитывая, что 1 M ( X ) и M 1 xB , получают M ( X ) xB .
Математическое ожидание является функцией от
неизвестного параметра заданного распределения, поэтому,
решив уравнение M ( X ) xB относительно неизвестного
параметра, тем самым получают его точечную оценку.
9.
Если распределение определяется двумя параметрами, топриравнивают два теоретических момента к двум
соответствующим эмпирическим моментам того же порядка.
Например, можно приравнять начальный теоретический момент
первого порядка к начальному эмпирическому моменту первого
порядка и центральный теоретический момент второго порядка к
центральному эмпирическому моменту второго порядка:
1 M1 , 2 m2 .
Учитывая, что 1 M ( X ), M 1 xB , 2 D( X ), m2 DB ,
M ( X ) xB ,
приходят к системе уравнений:
D( X ) DB .
Решив эту систему относительно неизвестных параметров,
получают их точечные оценки.
10.
Всюду выше неизвестный параметр оценивался однимчислом . Такая оценка называется точечной. При большом
числе опытов точечная оценка, как правило, близка к
неизвестному параметру.
Если же число наблюдений мало, то случайный характер
величины может привести к
значительному расхождению между и . Тогда возникает
задача о приближении параметра не одним числом, а целым
интервалом 1; 2 так, чтобы вероятность поглощения этим
интервалом параметра , т. е. вероятность двойного неравенства
1 ( x1, ..., xn ) 2 ( x1, ..., xn ),
была не меньше заданного числа .
11.
Интервал 1; 2 называется доверительным для параметрас доверительной вероятностью (надежностью) 0 1 ,
если неравенство 1 2 выполняется с вероятностью, не
меньшей чем , т. е. P( 1 2 ) .
Концы 1 и 2 доверительного интервала называются
доверительными границами для оцениваемого параметра .
Интервальной оценкой (с надежностью )
математического ожидания a нормально распределённого
количественного признака X по выборочной средней x B при
известном среднем квадратическим отклонении генеральной
совокупности служит доверительный интервал:
xB t
a xB t
, где t
– точность
n
n
n
оценки, t – значение аргумента функции Лапласа Ф(t),
при котором (t ) , n – объём выборки.
2
12.
При неизвестном (и объёме выборки n < 30) служитS
S
доверительный интервал: xB t
a
x
t
B
,
n
n
где t находят по таблице значений t t ( , n) по заданным
n и , S – исправленное выборочное
среднее квадратическое отклонение.
Интервальной оценкой (с надежностью ) среднего
квадратического отклонения нормально распределенного
признака X по исправленному выборочному среднему
квадратическому отклонению S служит доверительный
интервал: S (1 q) S (1 q), при q < 1,
0 S (1 q), при q > 1.
q находят по таблице значений q q( , n)
по заданным n и .
13.
Интервальной оценкой (с надежностью )неизвестной вероятности p биномиального распределения
по относительной частоте w служит доверительный интервал
2
n 2
t2
w(1 w) t
w
t
p1 p p2 , где p1 2
;
2n
n
t n
2n
2
n 2
t2
w(1 w) t
p2 2
w
t
,
2
n
n
2
n
t n
m
где w
– относительная частота;
n
n – общее число испытаний; m – число появлений события;
t – значение аргумента функции Лапласа, при котором
Φ(t )
( – заданная надежность).
2
При больших значениях n (порядка нескольких сотен)
можно принять в качестве приближенных границ
доверительного интервала величины
w(1 w)
w(1 w)
p1 w t
, p2 w t
.
n
n
14.
Выборочная совокупность задана таблицей распределения:xi
1
2
3
4
ni
20
15
10
5
Найти выборочную дисперсию.
Производим вычисления:
1 20 2 15 3 10 4 5 100
xB
2;
20 15 10 5
50
(1 2)2 20 (2 2)2 15 (3 2)2 10 (4 2) 2 5 50
DB
1.
50
50
15.
Имеется выборка:x1 71,88; x2 71,93; x3 72, 05; x4 72, 07;
x5 71,90; x6 72, 02; x7 71,93; x8 71, 77;
x9 72, 71; x10 71,96.
Найти выборочную дисперсию.
Возьмём ложный нуль C 72, 00. Вычислим разности i xi C :
1 0,12; 2 0, 07; 3 0, 05; 4 0, 07;
5 0,10; 6 0, 02; 7 0, 07; 8 0, 23;
9 0,11; 10 0, 04.
Их сумма: 1 2 3 ... 10 0,38;
1
1 2 3 ... 10 0, 038.
10
Выборочная средняя:
xB 72,00 0,038 71,962.
их среднее арифметическое:
16.
10i 1
10
( xi C )2
i2 0, 0144 0, 0049 0, 0025 0, 0049 0, 0100
i 1
0, 0004 0, 0049 0, 0529 0, 0121 0, 0016 0,1086.
( xВ C)2 (71,962 72,00)2 ( 0,038)2 0,0014.
Наконец, согласно формуле:
n
DB
1
( xi C )2 ( x B C )2 ,
n i 1
получим
1
DB 0,1086 0, 0014 0, 0094.
10
17.
Пусть дисперсия нормально распределенной СВ X равна 0,25.По выборке объема n 25 найдена выборочная средняя xB 52.
Найти доверительный интервал по неизвестному математическому
ожиданию m, если доверительная вероятность должна быть равна 0,95.
Решим уравнение 2Φ(t ) 0,95, используя таблицу значений
функции Лапласа. Для t получим значение 1,96. Затем найдём
концы доверительного интервала:
xB t
xB t
n
52 1,96
0, 25
52 1,96
0, 25
25
52 0,196 51,804;
52 0,196 52,196.
n
25
Таким образом, (51,804; 52,196) – искомый доверительный
интервал с надежностью 0,95, т. е.
P(51,804 m 52,196) 0,95.
18.
1. Выборочная совокупность задана таблицей распределения:xi
ni
4
10
7
15
10
20
15
5
Найдите выборочные среднюю x B и дисперсию DB.
2. Из генеральной совокупности извлечена выборка
объёма n = 50:
xi
ni
4
16
8
12
10
8
12
14
Найдите несмещённую оценку генеральной средней.
3. Выборочным путём были получены следующие
данные об урожайности ржи:
Урожайность, ц/га
Число, га
19
22
24
10
20
20
Определите выборочную среднюю x B и исправленное
среднее квадратическое отклонение S.
19.
4. По выборке объёма n = 51 определена выборочнаядисперсия DB = 6. Найдите исправленную дисперсию.
5. Получена таблица частот оценок по контрольной
работе у 40 студентов:
Оценка
Частота
4
3
5
8
6
25
9
4
Найдите:
1) выборочное среднее значение оценки;
2) выборочную дисперсию;
3) исправленную выборочную дисперсию;
4) выборочное среднее квадратическое отклонение;
5) исправленное выборочное среднее квадратическое отклонение.
6. Даны среднее квадратическое отклонение = 3,
выборочная средняя xB 4,1 и объем выборки n = 36 нормально
распределенного признака генеральной совокупности. Найдите
доверительный интервал для оценки генеральной средней
с заданной надежностью 0,95.
20.
7. По данным девяти независимых равноточных измеренийнекоторой физической величины найдены среднее
арифметическое результатов измерений xB 30,1 и
исправленное среднее квадратическое отклонение S = 6.
Оцените истинное значение измеряемой величины с помощью
доверительного интервала с надежностью 0,99.
Предполагается, что результаты измерений
распределены нормально.
8. Даны исправленное среднее квадратическое отклонение
S 0,8, выборочная средняя xB 20, 2 и объём выборки n 16
нормально распределенного признака генеральной
совокупности. Найдите, пользуясь распределением Стьюдента,
доверительный интервал для оценки генеральной средней
с заданной надёжностью 0,95.
9. Проводятся независимые испытания с одинаковой,
но неизвестной вероятностью p появления события A в каждом
испытании. Найдите доверительный интервал для оценки
вероятности p с надёжностью 0,95, если в 60 испытаниях
событие A появилось 15 раз.
21.
10. Ниже приведены результаты измерения ростаслучайно отобранных 100 студентов:
Рост, см 154–158 158–162 162–166 166–170 170–174 174–178 178–182
Число
12
12
26
30
10
8
2
студентов
Найдите выборочную среднюю и выборочную дисперсию
роста обследованных студентов. В качестве вариант следует
принять середины интервалов.
11. Найдите выборочную дисперсию по данному
распределению выборки объёма n 100 :
2502
18
xi
ni
2804
30
2903
50
3028
2
12. Найдите выборочную дисперсию по данному
распределению выборки объёма n 20:
xi
ni
0,01
10
0,04
8
0,08
2
22.
13. Из генеральной совокупности с нормальнымраспределением извлечена выборка объема n 10 и
составлена таблица частот:
xi
ni
–2
2
1
1
2
2
3
2
4
2
5
1
Найдите доверительный интервал для математического
ожидания с надёжностью 0,95.
14. В результате 10 независимых измерений длин труб
получено (в миллиметрах): 23 24 23 25 25 26 26 25 24 25.
Предполагая, что ошибка измерения распределена нормально,
найдите 95 % доверительный интервал для математического
ожидания длины трубы.
15. При 100-кратном повторении опыта некоторое событие
A наступило 78 раз. С надежностью 0,9 оцените неизвестную
вероятность события A.
16. Произведено 12 измерений одним прибором
(без систематической ошибки) некоторой физической величины,
причём исправленное квадратическое отклонение S случайных
ошибок измерений оказалось равным 0,6.
Найдите точность прибора с надежностью 0,99.