Лекция 9 Проверка статистических гипотез Критерии согласия. Критерий χ2 (Пирсона). Критерий Колмогорова. Критерий nω2. Критерии случайности.
Критерий согласия
Критерий χ2 (Пирсона)
Критерий χ2 (Пирсона) - продолжение
Критерий χ2 (Пирсона) - продолжение
Критерий Колмогорова
Критерий Колмогорова
Критерий nω2 (Крамера – Мизеса – Смирнова)
Критерий nω2 (Крамера – Мизеса – Смирнова) - 2
Критерии случайности
Критерий серий
Критерий общего числа серий
Пример расчета методом серий
Критерий наибольшей длины серий
Критерий числа повышений и понижений
Критерий числа экстремумов
СПАСИБО ЗА ВНИМАНИЕ!
442.50K
Categories: mathematicsmathematics physicsphysics

Проверка статистических гипотез (лекция 9)

1. Лекция 9 Проверка статистических гипотез Критерии согласия. Критерий χ2 (Пирсона). Критерий Колмогорова. Критерий nω2. Критерии случайности.

Лекция 9
Проверка статистических гипотез
Критерии согласия. Критерий χ2 (Пирсона).
Критерий Колмогорова. Критерий nω2.
Критерии случайности. Критерий серий
(Ахметов С.К.)

2. Критерий согласия

Критерии согласия – это статистики, которые позволяют
проверить соответствие эмпирической и аналитической кривых
распределения
Последовательность проверки:
- выдвигаются нулевая и альтернативная гипотезы
- назначается уровень значимости
- вычисляется эмпирическое значение тестовой статистики
- по результатам расчетов принимается решение
В качестве нулевой гипотезы принимается гипотеза о соответствие
(согласии) аналитической и эмпирической функций распределения
Степень согласия оценивается с помощью специальных статистик
В гидрологической практике наиболее часто применяются критерий χ2
(Пирсона), критерий Колмогорова и критерий nω2 (Крамера – Мизеса –
Смирнова).

3. Критерий χ2 (Пирсона)

Критерий χ2 был предложен в начале XX Карлом Пирсоном и в настоящее
время является наиболее распространенным критерием согласия
Последовательность применения:
Область допустимых значений (ОДЗ) исследуемой СВ Х разбивается на k
интервалов. Число интервалов можно рассчитать по формуле k ≈ 5lg (n)
Интервалы по оси Х не будут равновеликими, но зато вероятность
попадания значения СВ Х в любой интервал будет одинаковой p = 1/k
Теоретическое число случаев попадания значения СВ Х в каждый
интервал будет равно m = n/k (n – длина выборки)
Расхождение между эмпирическими данными и аналитической функцией
распределения определяется по тестовой статистике
где р* и рi – соответственно эмпирическая и теоретическая вероятность попадания
значения СВ в i – й интервал; n – длина выборки; k – число интервалов.

4. Критерий χ2 (Пирсона) - продолжение

Закон распределения данной статистики не зависит от вида исходного
распределения и при достаточно большом n хорошо аппроксимируется
распределением χ2 – квадрат с числом степеней свободы (v = k – r – 1);
где r – число параметров исходного распределения, определяемых по
эмпирическим данным
Учитывая, что p*= m*/n можно записать, что
В итоге получим, что
где m* и m – соответственно эмпирическое и теоретическое число
случаев попадания значения СВ Х в i- тый интервал.

5. Критерий χ2 (Пирсона) - продолжение

Из предыдущего выражения видно, что чем больше значение
статистики χ2, тем больше расхождение между эмпирической и
аналитической кривыми. Поэтому при использовании критерия χ2
(Пирсона) назначают односторонний уровень значимости (обычно α=5%
или α=10%).
Гипотеза о соответствии (согласии) эмпирической и аналитической
кривых обеспеченностей не опровергается, если эмпирическое значение
статистики χ2 не превышает теоретическое значение χ2, соответствующее
принятому уровню значимости (α), т.е. (χ2)* = χ21-α
Критерий χ2 может быть применен при выяснении вопроса о лучшем
соответствии одной из нескольких аналитических кривых распределения
одному и тому же эмпирическому ряду. При этом меньшее значение χ2
будет свидетельствовать о лучшем соответствии
данной функции
распределения эмпирическим данным
Принято считать, что критерий согласия χ2 допустимо применять при n
> 50. При этом желательно, чтобы число интервалов было равно 8-12 и в
каждом разряде было не менее 5 элементов.

6. Критерий Колмогорова

Мерой отличия эмпирической кривой распределения от теоретической
является абсолютное по величине расхождение между эмпирической Р*(х)
и аналитической Р(х) функциями обеспеченностей
∆ = max [Р*(х) - Р(х)]
Последовательность вычисления
1. Для каждого значения СВ Х вычисляются Р*(х), Р(х) и их разности
2. Выбирается наибольшее по модулю разность ∆
3. Рассчитывается статистика λ* = ∆√n, где n – объем выборки.
4. Функция обеспеченностей статистики λ при достаточно больших
значениях n (n>40) может аппроксимирована выражением
Координаты этой функции представлены в таблицах
5. Если значение Р(λ*) больше принятого уровня значимости, то гипотеза о
соответствии эмпирической и аналитической функций распределения не
опровергается

7. Критерий Колмогорова

Недостатки методики:
Учитывается только максимальное расхождение между
эмпирической и аналитической функциями распределения
Наибольшая разность ∆ обычно отмечается в средней части
кривой распределения, в то время как в гидрологической
практике чаще всего важно знать ее крайние левые и правые
части
Критерий не учитывает числа параметров, входящих в
теоретическую функцию распределения

8. Критерий nω2 (Крамера – Мизеса – Смирнова)

Тестовой статистикой данного критерия является средний квадрат
отклонений между аналитической Р(х) и эмпирической Р*(х) функциями
обеспеченностей по всем значениям случайной величины Х
где Р(х) – рассчитывается по формуле
pm = ((m-0.5)100%)/n
Для расчета Р(х) можно использовать формулу pm = (100m)/(n+1)
В этом случае выражение для тестовой статистики примет вид
При n>40 распределение статистики nω2 не зависит от вида исходного
теоретического распределения и близко к некоторому предельному
распределению, показанному ниже в таблице

9. Критерий nω2 (Крамера – Мизеса – Смирнова) - 2

Если эмпирическое значение тестовой статистики, вычисленное с
использованием выражения
оказывается больше теоретического значения nω2 при уровне
значимости α%, то гипотеза о соответствии эмпирической и
аналитической функций обеспеченностей опровергается.

10. Критерии случайности

Проверка гидрологических рядов на случайность
проводится в рамках общей схемы статистической проверки
гипотез. В качестве нулевой гипотезы принимается гипотеза
о том, что имеющаяся выборка представляет собой
последовательность независимых значений СВ
Применение критериев случайности основано на
сопоставлении конкретных статистик эмпирического ряда с
соответствующими
теоретическими
статистиками
случайных совокупностей

11. Критерий серий

Серия – это всякий участок последовательности, состоящий из элементов
одного и того же ряда
Длина серии – число элементов, входящих в серию
а
К серии из элементов
относятся члены последовательности, значения
которых превышают выборочное среднее (или медианное) значение
в
К серии из элементов
относятся члены последовательности, значения
которых меньше выборочного среднего (или медианного) значения

12. Критерий общего числа серий

Для проверки гипотезы о том, что данная совокупность сформирована из
независимых значений СВ, используется статистика
собой сумму серий из элементов
a, ra
значения не имеет). Пример расчета ra
и
в rв
R,
представляющая
(длина серий
i
при этом
и rв ясен из рисунка на след. слайде
Для случайных совокупностей статистика
R = ra + rв
имеет
нормальное распределение с параметрами
Исходя из этого, задавшись уровнем значимости
R доверительный интервал
α, можно построить для
где t1-α – квантиль стандартного нормального распределения (по таблице)
Если значение R*, определенное по выборке, попадает в этот интервал, то
гипотеза о случайности данной совокупности не опровергается.

13. Пример расчета методом серий

Допустим Qср. = 57,3 м3/с, тогда получим

14. Критерий наибольшей длины серий

Этот критерий использует в качестве тестовой статистики наибольшую
длину серии из элементов a и в:
K = imax.
Теоретически доказано, что для СВ значение K выражается формулой
где α – вероятность (в долях единицы), с которой в выборке объемом n
можно встретить хотя бы одну серию из элементов a и в длиной K и более.
При проверке нулевой гипотезы о случайности выборки эмпирическое
значение статистики K* сравнивается с теоретическим, рассчитанным по
вышепоказанной формуле
при уровне значимости α. Гипотеза не опровергается, если K*< K.

15. Критерий числа повышений и понижений

Пусть имеется выборка СВ Х:
Переход от xi-1 к
х1, х2, х3 ….хn.
xi, называется повышением и обозначается «+», если
xi-1 < xi,
Переход от
xi-1 к xi, называется понижением и обозначается « - «,
если xi-1 > xi,
Для случайных последовательностей число повышений и понижений
распределяется асимптотически нормально с параметрами
Задавшись уровнем значимости α и учитывая, что математические
ожидание и дисперсии числа повышений и понижений равны, можно
построить доверительный интервал
m – t’1-α√D < k < m + t’1-α√D
где k – число повышений (k+) или (k-) в исследуемой выборке; t’1- α –
квантиль нормального стандартного распределения
Если эмпирические значения k*+ или k *-. попадают в доверительный
интервал, гипотеза о случайности выборки не опровергается

16. Критерий числа экстремумов

Экстремум – это элемент последовательности
которого выполняется одно из неравенств
х1, х2, х3 ….хn для
Для выборок, представляющих собой последовательности независимых
значений СВ, число экстремумов распределено асимптотически
нормально с параметрами
Проверка гипотезы о случайности ряда производиться так же, как в
предыдущем случае

17. СПАСИБО ЗА ВНИМАНИЕ!

English     Русский Rules