Similar presentations:
Перевірка статистичних гіпотез
1. СТАТИСТИЧНА ПЕРЕВІРКА СТАТИСТИЧНИХ ГІПОТЕЗ
12.
Методи математичної статистики дозволяютьперевірити:
припущення про закон розподілу деяких
випадкових величин (генеральної сукупності);
про значення параметрів цього розподілу;
про наявність кореляційної залежності між
випадковими величинами, визначених на множині
об'єктів однієї і тієї ж генеральної сукупності.
2
3.
Статистичною називають гіпотезу провигляд невідомого розподілу, про
параметри відомих розподілів.
Задача полягає в тому, щоб підтвердити або
спростувати гіпотезу, використовуючи
вибіркові (експериментальні) дані.
3
4.
Перевірити статистичну гіпотезу – цеозначає перевірити, чи узгоджуються
вибіркові дані з цією гіпотезою.
Перевірка здійснюється за допомогою
статистичного критерію.
4
5.
Статистичний критерій – це випадковавеличина, закон розподілу якої (разом із
значеннями параметрів) відомий у випадку,
якщо прийнята гіпотеза справедлива.
Звичайно
використовуються
критерії
Стьюдента, Фішера, χ2 (Пірсона) та ін.
5
6. Послідовність дій
Крок 1. Сформулювати основну та альтернативнугіпотези.
Крок 2. Задати рівень значущості α.
Крок 3. Обираємо критерій для перевірки гіпотези
Крок 4. По таблиці знайти критичні значення та
побудувати критичну область.
Крок 5. За вибіркою порахувати значення статистики.
Крок 6. Порівняти отримане значення з критичною
областю. Зробити висновок
6
7. 1. Сформулювати основну та альтернативну гіпотези.
Нульовою (основною) гіпотезою називаютьвисунуту гіпотезу Н0. Разом з нульовою
гіпотезою Н0 висувається альтернативна або
конкуруюча гіпотеза Н1 , що суперечить
нульовій.
Наприклад :
1)Н0 : Q1 = Q2;
Н1 : Q1 > Q2 ;
2) Н0 : Q1 = Q2;
Н1 : Q1 < Q2;
3) Н0 : Q1 = Q2;
Н1 : Q1 ≠Q2.
7
8. 2. Задати рівень значущості α.
Виберемо деяку малу величину α (0,05;0,01; 0,001) – рівень значущості .
Ймовірність
α
називають
рівнем
значущості.
Це ймовірність здійснення помилки
першого роду, тобто відкидання гіпотези
Н0, коли вона вірна.
8
9. 3. Обираємо критерій для перевірки гіпотези
Нехайвипадкова
величина
К
–
статистичний критерій перевірки деякої
гіпотези Н0. При справедливості Н0 закон
розподілу
випадкової
величини
К
характеризується
деякою
відомою
щільністю розподілу ймовірності p(K).
9
10. 4. Знайти критичні значення та побудувати критичну область.
Визначимо критичне значеннякритерію Ккр як розв’язок одного з трьох
рівнянь залежно від вигляду Н0 та Н1 .
1) Н0 : Q1 = Q2;
Н1 : Q1 > Q2
Р (K > Kкритичне)= α ,
(1)
10
11.
2) Н0 : Q1 = Q2;Н1 : Q1 < Q2
Р (K < Kкритичне)= α ,
(2)
3) Н0 : Q1 = Q2;
Н1 : Q1 ≠ Q2
Р (K < Kкритичне1) + Р (K > Kкритичне2)= α. (3)
11
12.
Розв’язок рівнянь (1–3) полягає втакому: за заданою імовірністю α,
знаючи p(K), задану, як правило, у
вигляді таблиць, потрібно визначити
критичне значення критерію
(Kкритичне).
12
13.
Критичні значення відокремлюютькритичну область від області
прийняття гіпотези.
Критичні значення
Критична
область
Область
прийняття гіпотези
Критична
область
Можливі
значення
статистики
13
14.
Множина значень статистики включає двіобласті:
1 Область прийняття гіпотези, тобто
безліч тих значень статистики, при яких
гіпотеза Н0 приймається;
2 Критичну область, тобто безліч тих
значень статистики, при яких гіпотеза
Н0 відхиляється і приймається
альтернативна гіпотеза Н1.
14
15. 5. За вибіркою порахувати значення статистики.
Після побудови критичної областіобчислюють значення статистики по
вибірці і порівнюють його з критичною
областю.
15
16. 6. Порівняти отримане значення з критичною областю. Зробити висновок
Якщо значення статистики потрапило вобласть прийняття гіпотези, то гіпотеза
Н0 приймається
Якщо значення статистики потрапило в
критичну область, то гіпотеза H0
відхиляється і приймається
альтернативна гіпотеза H1
16
17.
Розглянемо рівнянняР (K > Kкритичне)= α (1).
Розв’язавши його, знаходимо значення
Kкритичне, що розбиває числову вісь на дві
області:
K< Kкритичне– область прийняття гіпотези;
K> Kкритичне– критична область.
17
18. Р (K > Kкр)= α
Р (K > Kкр)= αP(K )
Область прийняття гіпотези
K
К кр (критична область)
18
19.
Критична точка, щорівняння
(1),
правобічною.
отримана з
називається
Обчислюємо Kемпіричне – значення
критерію
K,
розраховане
за
вибірковими даними
19
20. Правило:
якщоКемпіричне > Ккритичне –
У цьому
випадку говорять, що гіпотеза H0 не
узгоджується з вибірковими даними. H0
відкидається;
Кемпіричне < Ккритичне– вибіркові
дані не суперечать гіпотезі H0. H0
приймається.
20
21. Р (K < Kкр)= α ,
Р (K < Kкр)= α ,Рівняння (2) визначає лівосторонню
критичну область.
P(K )
Критична
область
K кр
K
Область прийняття гіпотези
21
22.
Правило:якщо
Кемпіричне < Ккритичне– H0
відкидається;
Кемпіричне> Ккритичне– H0
приймається.
22
23.
Рівняння (3) визначає двостороннюкритичну область.
Звичайно Кkр1 і Кkр2 визначають таким
чином, щоб виконувалася умова
.
P( K K кp 2 ) P( K K кр1 ) 2
23
24.
P( K K кp 2 ) P( K K кр1 ) 2P (K )
2
2
K
K кр 2
K кр1
Правило:
|Kемпіричне|>Kкритичне – H0 відкидається ,
|Kемпіричне|<Kкритичне – H0 приймається.
Як бачимо, вигляд критичної області залежить від
того, яка гіпотеза висунута як конкуруюча.
24
25. Перевірка гіпотези про закон розподілу
Нехай необхідно перевірити гіпотезу Н0 про те,що вибірка підкоряється певному закону
розподілу, заданому функцією F(x). Під
альтернативною гіпотезою H1 в цьому випадку
будемо підрозумівати те, що просто не виконано
основну гіпотезу.
Потрібно зробити висновок: чи погоджуються
результати спостережень із висловленим
припущенням. Для цього використаємо
спеціально підібрану величину – критерій згоди.
25
26.
Критерій згоди Пірсона – найбільш частовживаний критерій для перевірки гіпотези
про закон розподілу.
Для перевірки гіпотези про закон розподілу
необхідно розрахувати емпіричні і
теоретичні частоти.
26
27. Емпіричні та теоретичні частоти. Безперервний розподіл
Нехай при дослідженні випадковоївеличини була отримана вибірка розміром
n. Весь інтервал можливих значень
поділяють на k інтервалів. Інтервали не
перетинаються і рівні між собою. Потім
обчислюють
ni– кількість значень, що
потрапили в i-й інтервал. Емпіричними
називають частоти ni, що фактично
спостерігаються .
27
28. Теоретичні частоти
Теоретичні частоти безперервного розподілузнаходять за формулою
ni NPi
'
,
де N – число випробувань;
Pi– ймовірність влучення X у i-й частковий
інтервал, обчислена при допущенні, що X має
функцію розподілу F(x).
28
29. Теоретичні частоти
ni N ( F ( xi ) F ( xi 1 )).'
Зокрема, якщо є підстави припускати, що
випадкова величина X розподілена
нормально, то теоретичні частоти,
обчислюють таким чином
29
30. Теоретичні частоти
ni N ( НОРМРАСП ( xi , x, S ,1)'
НОРМРАСП ( xi 1 , x, S ,1)),
де N – число випробувань;
xi – права границя i-го інтервалу;
– середнє значення;
x
S – стандартне відхилення.
30
31. Критерій згоди Пірсона
Нульова гіпотеза: генеральна сукупністьрозподілена за законом F(x). В якості критерію
обираємо випадкову величину
(ni ni )
емпіричне
'
ni
i 1
L
' 2
2
де ni – емпіричні частоти;
ni’ – теоретичні частоти.
31
32.
Для рівня значущості α знаходимо2kp , розв’язуючи рівняння
P( 2> 2критичне )= α,
2критичне=ХИ2OБР( α; K),
де K = L - 1 - r ;
L – число часткових інтервалів;
r – число параметрів розподілу. Для
нормального закону r = 2.
32
33.
Якщо 2 емпіричне< 2критичне – гіпотезупро закон розподілу приймаємо.
Якщо 2 емпіричне > 2критичне – гіпотезу
Н0 відкидаємо.
Обсяг вибірки повинен бути більше ніж 50.
33
34. Приклад
У таблиці наведені значення частот.Розрахувати теоретичні частоти в
припущенні, що вибірка має нормальний
закон розподілу. Відомо, що x =42,37,
S=0,94. З рівнем значущості α=0,01
перевірити гіпотезу про закон розподілу.
34
35.
iінтервали
ni – емпіричні
частоти
0
(-∞;40]
0
1
(40;41]
20
2
(41;42]
112
3
(42;43]
154
4
(43;44]
73
5
(44;46]
15
Оскільки x =42,37, S=0,94, нормальний
закон розподілу для нашої вибірки можна
записати у вигляді N(42,37; 0,94).
35
36. Перевірка гіпотези про закон розподілу
( ;40]40
(40;41]
41
(41;42]
42
(42;43]
43
(43;44]
44
(44;46]
46
Сума
36
39,5
40,5
41,5
42,5
43,5
45
F(X)
Pi
n’i
F(Xi)-F(Xi-1)
Теоретичні
частоти
NPi
Xi
ni
НОРМРАСП(Xi,
xср, S,1)
Кишені
Серед
ини
інтерв
алів
(Xi+ Xi-1)/2
Інтервал
Емпіричні
частоти
Перевірка гіпотези про закон розподілу
i2
(n i - n i' ) 2
n i'
0
0,0058
20
0,0724
0,066
24,92
0,97
112
0,3469
0,274
102,63
0,85
154
0,7486
0,401
150,23
0,09
73
0,958
0,209
78,50
0,38
15
374
0,999
0,0413
15,48
0,015
2,32
2 емпіричне =
2критичне = ХИ2ОБР(0,01;2)=
9,21
37.
Для розглянутого прикладу 2емпіричне= 2,32.2 критичне= Хи2Обр(0,01; 2) = 9,210351
(K = 5 – 1 – 2 = 2).
Оскільки 2 емпіричне< 2 критичне, гіпотеза про
нормальний закон розподілу
N(20,27; 1,96) приймається з рівнем
значущості 0,01.
37
38.
180160
140
120
100
Ряд1
80
Ряд2
60
40
20
0
40
41
42
43
44
45
46
38
39. Параметрична статистика
3940.
При перевірці будь-якої гіпотези необхідноспиратися
на
якусь
сукупність
припущень, з яких і виводяться формули,
необхідні для цієї перевірки. При цьому
серед інших завжди наявні припущення
про закон розподілу.
Невиконання цих передумов робить
некоректним застосування відповідних
методів.
40
41.
Параметричніметоди
припускають
конкретний розподіл. Ці методи строго
обґрунтовані і добре вивчені.
Надалі ми будемо розглядати критерії, в
основі яких лежить припущення про
нормальний закон розподілу.
41
42. Перевірка гіпотези про нормальний розподіл вибірки
Точна перевірка (критерій Пірсона) доситьтрудомістка, і обсяг вибірки повинен бути
досить
великим
(n>50),
тому
використовують перевірку умов, що є
наслідком
з
нормального
закону
розподілу.
42
43. І спосіб - RS-метод
RS-метод полягає в наступному:Розраховуємо величину розмаху R між
рівнями ряду і їх стандартне відхилення S: R
= Xmax – Xmin;
S
1
2
( xi x )
n 1
Тоді
розрахункове значення величини RS
дорівнює відношенню RS = R / S.
43
44.
Розраховане значення величини RSпорівнюється з табличним RSкритерієм (а саме, з його нижньою і
верхньою межею для рівня значущості
). Якщо ці значення не потрапляють в
інтервал між критичними (табличними)
межами, то гіпотеза про нормальний
закон відхиляється.
44
45.
Наведемо декілька табличних значеньмеж RS-критерію (для = 0,05):
для n = 10 нижня межа: 2,67; верхня
межа: 3,685;
для n = 20 нижня межа: 3,18; верхня
межа: 4,49;
для n = 30 нижня межа: 3,47; верхня
межа: 4,849.
45
46. II спосіб
У випадку нормального розподілу оцінкидисперсії асиметрії As та ексцесу Ek
дисперсії визначаються виразами
2
Ek
2
As
6 n(n 1)
(n 3)(n 1)(n 2)
24n(n 1) 2
.
(n 5)( n 3)( n 2)( n 3)
46
47.
На практиці можна користуватися такимнаближеним критерієм згоди :
Аs 2 As
Ek 2 Ek
Якщо ці нерівності виконуються, то можна
вважати, що гіпотеза про нормальний
розподіл не суперечить наявним даним.
47
48. F-розподіл (розподіл Фішера)
Випадкова величина F розподілена зазаконом розподілу Фішера з k1 і k2
ступенями вільності
F
k1
k 2
,
k1
k2
де , – випадкові величини, що
розподілені за законом 2 з k1 та k2
ступенями вільності відповідно.
48
49.
4950.
При заданих числах k1 і k2 та займовірністю
α
за
таблицею
визначається значення F α, таке, що
P(F > F α) = α.
50
51. Excel
FРАСП( Fα ; ступені_вільності_1;ступені_вільності_2).
Повертає ймовірність α, що є розв’язком
рівняння
P( F F )
51
52.
FРАСПОБР (ймовірність;ступені_вільності1; ступені_вільності2) –
обчислюється значення Fα, що є
розв’язком рівняння
P( F F )
52
53.
α53
54. Порівняння двох дисперсій нормальної генеральної сукупності
На практиці задача порівняння дисперсійвиникає, якщо потрібно порівняти
точність приладів, інструментів, методів
вимірювань та ін. Кращим є той прилад
або метод, що забезпечує найменше
розсіювання результатів, тобто меншу
дисперсію.
54
55. Критерій Фішера
Вимога до даних: дані незалежніі
розподілені нормально.
Призначення:
перевірка гіпотези про
належність двох дисперсій до однієї
генеральної сукупності і, отже, їхньої
рівності.
55
56.
Отже, нехай генеральні сукупності ознак X і Yрозподілені нормально. З двох незалежних
вибірок обсягами n1 і n2 обчислені
“виправлені” вибіркові дисперсії Sx2, Sy2.
Потрібно при даному значенні α перевірити
основну гіпотезу про рівність генеральних
дисперсій
H0: Sx2= Sy2.
56
57. Критерій Фішера
За критерійперевірки нульової гіпотези
приймаємо відношення більшої “виправленої”
дисперсії S12 до меншої S22, тобто випадкову
величину
K F
2
s1
2
s2
57
58.
Величина F має розподіл Фішера зk1=N1-1; k2=N2-1 ступенями вільності,
де N1 і N2 – розміри вибірок (S12 > S22).
Критична область будується
в
залежності від виду конкуруючої
гіпотези.
58
59.
1) H 0 : S S2
1
2
2 ;
H1 : S S
2
1
2
2 .
Fкритичне знаходимо з рівняння
P( F Fкритичне ) .
Fкритичне знаходять за таблицею по
заданому рівню значущості та ступенях
вільності k1 та k2.
59
60.
ЯкщоFрозраховане < Fкритичне –
гіпотеза H0 приймається, тобто можна
вважати, що вибіркові дисперсії різняться
несуттєво.
У протилежному разі – H0 відхиляється;
60
61.
2 H 0 : S S ; H 1 : S S ;Fкр знаходимо з рівняння P ( F Fкр ) / 2 ;
Fр < Fкр – гіпотеза Н0 – приймається;
Fр >Fкр – Н0 відкидається.
2
1
2
2
2
1
2
2
61
62.
В Excel: функція FРАСПОБР( ; k; k2) –повертає Fкр. однобічне.
Пакет Анализ данных:
Сервис
–
Анализ
данных
–
Двухвыборочный F-тест для дисперсии.
62
63. Приклад.
У таблиці наведені показники продуктивностіпраці робітника на верстаті до і після
удосконалення за 7 і 6 годин відповідно. Чи
можна при рівні значущості = 0,05 вважати
удосконалення ефективним?
Старий
42
43
38
40
43
38
Новий
42
43
44
42
43
43
40
63
64.
Ефективність верстата залежить віддисперсії. Завдання полягає в порівнянні
двох дисперсій.
Висуваємо гіпотези:
H 0 :S S H1 : S S
2
1
2
2
2
1
2
2
64
65.
Розрахунки можна провести за допомогою пакета аналізу,обираємо: Сервис – Анализ данных.
65
66.
Обираємо Двухвыборочный F-тест для дисперсии.66
67.
alfa=0,05Двухвыборочный F-тест для дисперсий
Переменная 1
Переменная 2
Среднее
40,57142857
42,83333333
Дисперсия
4,619047619
0,566666667
Наблюдения
7
6
df
6
5
F
8,151260504
P(F<=f) одностороннее
0,017997241
F критическое
одностороннее
4,950294397
67
68.
df – кількість ступенів вільності,F – розраховане значення Fрозраховане,
F критическое одностороннее – відповідно
Fкритичне.
Fрозраховане > Fкритичне, отже, приймаємо
гіпотезу Н1: S12 > S22 , тобто дисперсії різняться
суттєво.
Висновок: можна вважати удосконалення верстата
ефективним.
68
69. Порівняння виправленої вибіркової дисперсії з гіпотетичною генеральною дисперсією
На практиці ця гіпотеза перевіряється,якщо
потрібно
перевірити,
чи
відповідає
точність
приладів,
інструментів,
методів
та
ін.
необхідному стандартові
69
70.
Критерій перевірки2
(n 1) S
2
2
0
розподіл Пірсона з k = n – 1 ступенями
вільності.
70
71.
H0: S2 = 02,Н1: S2 > 02.
кр2 обчислюємо, як розв’язок рівняння
Р( 2 > кр2) = α.
χ2кр= ХИ2ОБР(α; n-1)
Якщо 2р < 2кр – H0 приймається.
71
72. Перевірка гіпотез про середні для нормальної генеральної сукупності
Можливі такі постановки задач:1. Порівняння показників контрольної
і
експериментальної вибірок.
Можливі такі випадки:
А) Вибірки невеликого обсягу (n<30):
• дисперсії вибірок рівні;
• дисперсії вибірок не рівні;
Б) без припущення про дисперсії (вибірки
великі n>30);
72
73.
2 Порівняння показників вибірки до іпісля експерименту. У цьому випадку ми
маємо справу з так званими зв'язними
вибірками.
3 Чи можна вважати, що деяке значення
показника
дорівнює
деякому
нормальному значенню.
73
74. Перевірка гіпотези про рівність середніх при рівних дисперсіях (малі вибірки n<30)
Перевірка гіпотези про рівність середніх прирівних дисперсіях (малі вибірки n<30)
Умови:
Вибірки розподілені нормально.
Дисперсії невідомі й однакові: .
Дані незалежні.
74
75.
Використовується критерій Стьюдента :t
x1 x2
(n1 1) S1 (n2 1) S 2
2
2
n1n2 (n1 n2 2)
n1 n2
з k=n1+n2-2 ступенями вільності,
де n1, n2-обсяг вибірок;
x1 , x2 середні значення;
2
2
S1 , S 2 виправлені дисперсії.
75