Similar presentations:
Анализ частот. Лекция 7
1. ЛЕКЦИЯ 7
(F T)T
2
ЛЕКЦИЯ 7
АНАЛИЗ ЧАСТОТ
2
2. 7.1. z-критерий
3. t-критерий Стьюдента
x1 x2t
sx1 x2
4. z-критерий
p1 p2z
s p1 p2
5. Стандартная ошибка разности долей
s p1 p2 s s2
p1
2
p2
6. Дисперсии долей, характеризующих выборки с объемами n1 и n2
s p1p1 (1 p1 )
n1
s p2
p2 (1 p2 )
n2
7. Развернутая формула z-критерия
zp1 p2
p1 (1 p1 ) p2 (1 p2 )
n1
n2
8. Условие применимости z-критерия
z-критерий применим приnp и n(1 – p) > 5
т.к. именно в этом случае значения
критерия распределены нормально.
9. Как узнать критические значения z-критерия?
Критическое значение zможно найти в последней
строчке таблиц с
критическими значениями
t-критерия при n = ∞
10. 7.2. Таблицы сопряженности: критерий χ2
11. 111 мышей
57бактерии+сыворотка
13 погибло
54
бактерии
25 погибло
Различается ли выживаемость?
12. Влияет ли введение сыворотки на выживаемость мышей?
ПогибшиеВыжившие
Всего
Бактерии +
сыворотка
13
44
57
Только
бактерии
25
29
54
Всего
38
73
111
13. Общий вид таблицы сопряженности размером «2х2»
ab
a+b
c
d
c+d
a+c
b+d
n = a+b+c+d
14. Н0 в эксперименте с мышами:
Введение сыворотки неоказывает никакого
влияния на выживаемость
мышей
15. Расчет ожидаемых частот:
Всего в экспериментепогибло 34.2% от общего их
числа.
нужно рассчитать, сколько
составляют 34.2% от 57 и 54:
Получаем: 19.5 и 18.5
соответственно.
16. Расчет ожидаемых частот:
Выживаемость в целом поэксперименту составила 73
мыши, или 65.8%.
нужно рассчитать, сколько
составляют 65.8% от 57 и 54:
Получаем: 37.5 и 35.5
соответственно.
17. Ожидаемые частоты
ПогибшиеВыжившие
Всего
Бактерии +
сыворотка
19.5
37.5
57
Только
бактерии
18.5
35.5
54
Всего
38
73
111
18. Критерий χ2
(F
T
)
2
T
2
19. Применим формулу критерия χ2 для данных, полученных в эксперименте с мышами
(13 – 19.5)2/19.5 + (44 – 37.5)2/37.5 ++ (25 – 18.5)2/18.5 + (29 – 35.5)2/35.5 =
= 2.16 + 1.12 + 2.31 + 1.20 = 6.79
20. χ2-распределение для таблиц сопряженности размером 2 х 2
3,8421. Условие применения χ2-критерия
Условие применения χ2критерия2
χ -критерий применим
только если ожидаемое
число в любой из ячеек
таблицы больше или
равно 5
22. Критическое значение χ2-критерия зависит от числа степеней свободы:
Критическое значение χ2критерия зависит от числастепеней свободы:
df = (R-1)(C-1),
где R – количество строк, С –
количество столбцов в таблице.
23. Поправка Йетса на непрерывность для χ2-критерия
1F T
2
2
T
2
В примере с мышами скорректированное
значение χ2-критерия составляет 5.789
24. Применение χ2-критерия для определения нормальности распределения данных
С помощью χ2 определяют степеньсоответствия наблюдаемых частот
вариант их теоретически ожидаемым
частотам, соответствующим
нормальному распределению.
25. Другие способы определения нормальности распределения:
Визуальное изучение формы гистограммыили полигона распределения
26. Другие способы определения нормальности распределения:
Использование «вероятностной бумаги»27. Другие способы определения нормальности распределения:
При нормальном распределениив интервал от -2 до +2 σ
укладываются около 95% всех
вариант, от -σ до + σ – около 68%
28. Другие способы определения нормальности распределения:
Специальные тесты нанормальность:
тест Колмогорова-Смирнова
(Kolmogorov-Smirnov test for
normality);
тест Лиллиефорса (Lilliefors test
for normality);
тест Шапиро-Уилка (ShapiroWilk’s W test).
29. Специальные тесты на нормальность:
7.3. Точный критерийФишера (Fisher’s exact
test)
30. 7.3. Точный критерий Фишера (Fisher’s exact test)
Вероятность случайным образомполучить таблицу сопряженности 2х2 с
определенными значениями ячеек
R1! R2 !C1!C2 !
!
N
P
O11!O12!O21!O22!
31. Вероятность случайным образом получить таблицу сопряженности 2х2 с определенными значениями ячеек
Обозначения, используемые вточном критерии Фишера
О11
О12
R1
О21
О22
R2
C1
C2
N
32. Обозначения, используемые в точном критерии Фишера
Частота указания варианта точногокритерия Фишера в 2 медицинских
журналах
Вариант
указан
Вариант не
указан
Всего
New England
Journal of
Medicine
1
8
9
Lancet
10
4
14
Всего
11
12
23
McKinney W. P. et al. 1989. The inexact use of Fisher’s exact
test in six major medical journals. JAMA, 261: 3430-3433.
33. Частота указания варианта точного критерия Фишера в 2 медицинских журналах
9!4!11!12!23
!
P
0.00666
1!8!10!4!
34.
Частота указания варианта точногокритерия Фишера в 2 медицинских
журналах
Вариант
указан
Вариант не
указан
Всего
New England
Journal of
Medicine
0
9
9
Lancet
11
3
14
Всего
11
12
23
35. Частота указания варианта точного критерия Фишера в 2 медицинских журналах
9!4!11!12!23
!
P
0.00027
0!9!11!3!
36.
Результат одностороннего вариантаточного критерия Фишера:
Р = 0.00666 + 0.00027 =
0.00695
37. Результат одностороннего варианта точного критерия Фишера:
38.
Суммируем все «маловероятные»варианты заполнения таблицы:
Р = 0.00666 + 0.00027 +
0.00242 + 0.00007 = 0.00944