Проверка статистических гипотез
Классификация гипотез
Статистический критерий. Критическая область
118.00K
Category: mathematicsmathematics

Проверка статистических гипотез

1. Проверка статистических гипотез

Статистической гипотезой называют, всякое
высказывание о генеральной совокупности,
проверяемое по выборке (высказывание о виде
неизвестного распределения или о параметрах
известного распределения).
Проверка статистической гипотезы заключается
в сопоставлении некоторых статистических
показателей, вычисленных по данным выборки со
значениями этих же показателей, определенных
теоретически в предположении, что проверяемая
гипотеза верна.

2. Классификация гипотез

Гипотезу, которую выдвигают для проверки,
называют нулевой (основной) и обозначают Н0
(предположение, которого мы придерживаемся
изначально, пока наблюдения не заставят нас
признать обратное)
Гипотезу, противоречащую основной,
называют конкурирующей (альтернативной) и
обозначают Н1
Различают также простые и сложные
гипотезы.

3.

Решение о том, можно ли считать гипотезу
справедливой для генеральной совокупности
принимается по данным выборки, т.е. по
ограниченному ряду наблюдений, следовательно это
решение может быть ошибочным.
В результате проверки гипотезы могут быть
приняты два неправильных решения, т.е. допущены
ошибки двух родов.
Ошибка первого рода состоит в том, что будет
отвергнута нулевая гипотеза, хотя в действительности
она верна (риск заказчика).
Ошибка второго рода состоит в том, что будет
принята нулевая гипотеза, хотя в действительности
верна альтернативная.

4.

Опр. 1. Вероятность совершить ошибку первого рода
называется уровнем значимости и обозначается α,
т.е.
α = Р(Н1/Н0).
Уровень значимости задают заранее малым числом.
На практике, наиболее часто используют α =0, 001;
0, 01; 0,05 .
Для α = 0, 05 это означает, что в 5 случаях из 100
имеется риск допустить ошибку первого рода, т.е.
отвергнуть нулевую гипотезу, тогда как, она верна.
Вероятность ошибки второго рода обозначают
β = Р(Н0/Н1)

5.

Таблица

6. Статистический критерий. Критическая область

Для проверки нулевой гипотезы, используют специально
подобранную случайную величину, точное или приближенное
распределение которой известно.
Опр. 1. Статистическим критерием называют случайную
величину служащую для проверки нулевой гипотезы.
Пример.
Основные задачи статистической проверки гипотез:
о виде распределения;
сравнение нескольких выборочных распределений между
собой;
сравнение двух или нескольких средних или дисперсий.
Необходимые и достаточные критерии для проверки
этих гипотез:
Χ2 – критерий К. Пирсона;
λ – критерий Колмагорова-Смирнова;
t – критерий Стьюдента;
F – критерий Снедекора-Фишера;
G – критерий Кочрена

7.

Опр.2. Наблюдаемым значением Кнабл
критерия называют, значение критерия
вычисленное выборке.
После выбора определенного критерия,
множество всех его возможных значений
разбивается на два непересекающихся
подмножества: одно из них содержит
значения критерия при котором нулевая
гипотеза отвергается; а другое содержит
значения критерия при которых нулевая
гипотеза принимается.

8.

Опр. 3. Критической областью называют, совокупность
значений критерия, при которых нулевую гипотезу
отвергают.
Опр. 4. Областью принятия гипотезы (областью
допустимых значений), называют совокупность значений
критерия при которой нулевую гипотезу принимают.
Основной принцип проверки статистических
гипотез:
если наблюдаемое значение критерия принадлежит
критической области, то гипотезу отвергают; если
наблюдаемое значение критерия принадлежит области
покрытия гипотезы, то гипотезу принимают.

9.

Опр. 5. Критическими точками
(границами) kкр называют точки
отделяющие критическую область от
области принятия гипотез.
При этом, различают:
Правостороннюю критическую область;
Левостороннюю критическую область;
Двустороннюю критическую область.

10.

Правосторонняя критическая область определяется
неравенством К>kкр, kкр>0, где kкр удовлетворяет
условию P(K>kкр)=
Левосторонняя критическая область определяется
неравенством К<kкр, kкр<0, где kкр удовлетворяет
условию P(K<kкр)=
Двусторонняя критическая область определяется
двумя неравенствами К< k1 ,К >k2,
k2 > k1 , где
k2 и k1 определяются из условий P(K<k1)= /2,
P(K >k2)= /2

11.

Замечания. 1. Критическую область обычно
выбирают в зависимости от целей исследования:
если цель исследования состоит в выявлении
различий параметров двух генеральных
совокупностей и неизвестно какой из параметров
больше, то выбирают двустороннюю критическую
область;
Если необходимо доказать увеличение или
уменьшение параметра, то пользуются
односторонней критической областью
2. Когда имеются основания для применения
одностороннего критерия, его следует предпочесть
двустороннему, потому что односторонний
критерий полнее использует информацию об
изучаемом явлении и поэтому чаще дает
правильные результаты.

12.

3. Пусть нулевая гипотеза принята,
ошибочно думать, что тем самым она доказана
(действительно, известно, что один пример,
подтверждающий справедливость некоторого
общего утверждения, еще не доказывает его).
Поэтому более правильно говорить, что
«данные наблюдений согласуются с нулевой
гипотезой и, следовательно, не дают оснований
ее отвергнуть».
На практике для большей уверенности
принятия гипотезы ее проверяют другим
способом или на основании данных нового
эксперимента с увеличенным объемом выборки.

13.

4. Отвергают гипотезу более категорично
(действительно, известно, что достаточно
привести один пример, противоречащий
некоторому общему утверждению, чтобы это
утверждение отвергнуть). Если оказалось,
что наблюдаемое значение критерия
принадлежит критической области, то этот
факт и служит примером, противоречащим
нулевой гипотезе, что позволяет ее отклонить

14.

При построении критической области, мы
исходили из того, что вероятность попадания
наблюдаемого значения критерия в
критическую область равна . Но
критическая область этим требованием
определяется неоднозначно.
Поэтому, кроме названного требования
выдвигается еще одно: критическая область
должна быть расположена так, чтобы при
заданной вероятности - ошибки первого
рода, вероятность - ошибки второго рода
была минимальной.

15.

Опр. 6. Мощностью критерия называется
вероятность попадания критерия в
критическую область, при условии, что
конкурирующая гипотеза справедлива:
РН (Н1) = 1- .
Очевидно, что если мощность критерия 1 возрастает, то - вероятность ошибки
второго рода уменьшается.
Таким образом, если уровень значимости
уже выбран, то критическую область следует
строить так, чтобы мощность критерия была
максимальной.
1

16.

Замечание. Ясно, чем меньше вероятность
ошибки первого и второго рода, тем
критическая область «лучше». Однако, при
заданном объеме выборки уменьшить
одновременно и невозможно: если
уменьшать , то будет возрастать.
Как наиболее целесообразно выбрать
критерий?
Теорема Неймана-Пирсона.
Среди всех критериев, различающих
гипотезы Н0 и Н1 с заданной ошибкой первого
рода , наиболее мощным является критерий
отношения правдоподобия.
English     Русский Rules