ЛЕКЦИЯ 6
6.1. Принцип теста Стьюдента (t-теста)
Схема испытания диуретического действия препарата Х
Результат испытания действия диуретика
Повторный эксперимент, с большим числом участников
Точность выборочной средней оценивается с помощью стандартной ошибки
Критерий Стьюдента (t-критерий)
Стандартное отклонение разности двух чисел
Дисперсия разности двух случайно извлеченных значений
Стандартная ошибка разницы двух средних
6.2. Критическое значение t
Распределение 200 человек по величине диуреза (t = -0.2)
Еще одна пара выборок… (t = -2.2)
И еще одна пара выборок… (t = 0)
Распределение значений t, вычисленных по 200 парам выборок
В 10 случаях из 200 (т.е. в 5% всех случаев) t меньше -2.1 или больше +2.1
Распределение значений t при бесконечно большом числе испытаний
t = -2.2: различия есть???
Критические значения t при α = 0.01: t0.01 = ±2.88
t = -2.2: различий нет!!!
Уровень значимости следует оговаривать до начала изложения результатов!
Чем определяется критическое значение t ?
6.3. Типичные ошибки в использовании критерия Стьюдента
Пример неправильного использования t-теста
Вероятность ошибиться хотя бы в одном из k сравнений при α = 0.05
Результаты исследования влияния гормонов человека на рост марсиан
Результаты исследования влияния гормонов человека на рост марсиан
6.4. Непараметрические методы сравнения двух выборок
Мы рассмотрим ранговые тесты:
Пример подсчета суммы рангов в двух сравниваемых выборках
Данные Норм. распр., Ненорм. распр., дисп. одн. дисп. неодн. Зависимые Независимые Зависимые Независимые Парный t-тест t-тест
6.5. Методы множественных сравнений
Для чего разработаны методы множественных сравнений?
Post-hoc анализ (=апостериорный анализ):
Поправка Бонферрони (Bonferroni correction):
Критерий Ньюмена-Кейлса (Newman-Keuls test)
Другие методы множественных сравнений:
Результаты выполнения теста Ньюмена-Кейлса в программе STATISTICA
1.15M
Category: mathematicsmathematics

Сравнение двух групп и множественные сравнения. Лекция 6

1. ЛЕКЦИЯ 6

x1 x2
t
sx1 x2
СРАВНЕНИЕ ДВУХ ГРУПП И
МНОЖЕСТВЕННЫЕ
СРАВНЕНИЯ

2. 6.1. Принцип теста Стьюдента (t-теста)

3. Схема испытания диуретического действия препарата Х

10 добровольцев
ПРЕПАРАТ
ПЛАЦЕБО

4. Результат испытания действия диуретика

5. Повторный эксперимент, с большим числом участников

6. Точность выборочной средней оценивается с помощью стандартной ошибки

s
sx
n

7.

Чем меньше
стандартные ошибки средних
двух сравниваемых групп,
тем меньше и неопределенность
в оценке разности этих двух средних.

8. Критерий Стьюдента (t-критерий)

x1 x2
t
sx1 x2

9. Стандартное отклонение разности двух чисел

10. Дисперсия разности двух случайно извлеченных значений

11. Стандартная ошибка разницы двух средних

sx1 x2 s s
2
x1
2
x2

12. 6.2. Критическое значение t

13. Распределение 200 человек по величине диуреза (t = -0.2)

14. Еще одна пара выборок… (t = -2.2)

15. И еще одна пара выборок… (t = 0)

16. Распределение значений t, вычисленных по 200 парам выборок

-2
0
t-распределение
симметрично
относительно 0
2

17. В 10 случаях из 200 (т.е. в 5% всех случаев) t меньше -2.1 или больше +2.1

18. Распределение значений t при бесконечно большом числе испытаний

-2
0
2

19. t = -2.2: различия есть???

20. Критические значения t при α = 0.01: t0.01 = ±2.88

21. t = -2.2: различий нет!!!

22. Уровень значимости следует оговаривать до начала изложения результатов!

В разделе Материал и методы:
... «различия считали статистически
значимыми при Р<0.01»

23. Чем определяется критическое значение t ?

Уровнем значимости:
чем < α, тем > t
Числом степеней свободы:
df = n1 + n2 – 2
чем > n1 + n2 , тем <t

24. 6.3. Типичные ошибки в использовании критерия Стьюдента

25.

Критерий Стьюдента
предназначен исключительно
для сравнения ДВУХ групп!!!

26. Пример неправильного использования t-теста

ВЕЩЕСТВО
ВЕЩЕСТВО
ПЛАЦЕБО
А
В
С
Р1
Р2
Р3

27. Вероятность ошибиться хотя бы в одном из k сравнений при α = 0.05

Р′ = 0.05k

28. Результаты исследования влияния гормонов человека на рост марсиан

29. Результаты исследования влияния гормонов человека на рост марсиан

t = 0.93
t = 2.39
t0.05 = 2.101
t = 1.34
F = 2.74
F0.05 = 3.35

30.

Критерий Стьюдента является
параметрическим критерием!

31. 6.4. Непараметрические методы сравнения двух выборок

32. Мы рассмотрим ранговые тесты:

U-тест Манна-Уитни (Mann-
Whitney U-test);
Тест Уилкоксона (Wilcoxon
matched pairs test)

33. Пример подсчета суммы рангов в двух сравниваемых выборках

Выборка А
хi
Ранг
104
2
109
6
112
7
118
8
118
8
Сумма рангов =
31
Выборка В
хi
Ранг
100
1
105
3
107
4
107
4
108
5
Сумма рангов =
17

34. Данные Норм. распр., Ненорм. распр., дисп. одн. дисп. неодн. Зависимые Независимые Зависимые Независимые Парный t-тест t-тест

Данные
Норм. распр.,
дисп. одн.
Зависимые
Независимые
Парный t-тест t-тест
Ненорм. распр.,
дисп. неодн.
Зависимые
Независимые
Тест Вилкоксона U-тест

35. 6.5. Методы множественных сравнений

36. Для чего разработаны методы множественных сравнений?

Дисперсионный анализ
позволяет проверить гипотезу о
равенстве всех средних. Но если
гипотеза не подтверждается,
нельзя узнать, какая именно
группа отличается от других.

37. Post-hoc анализ (=апостериорный анализ):

Это группа методов, используемых
после дисперсионного анализа
для уточнения его результатов.

38. Поправка Бонферрони (Bonferroni correction):

α′ = α/k
Например, при k = 3, в каждом
из сравнений
α′ = 0.05/3 = 0.017 (1.7%)
Работает, если k невелико!

39. Критерий Ньюмена-Кейлса (Newman-Keuls test)

q
x A xB
1
1
2 n A nB
S
2
вну

40. Другие методы множественных сравнений:

Критерий Тьюки (Tukey honest
significant difference (HSD) test);
Критерий Шеффе (Scheffe test);
Критерий Даннета (Dunnet test)

41.

Результаты выполнения
теста Тьюки в программе
STATISTICA

42. Результаты выполнения теста Ньюмена-Кейлса в программе STATISTICA

English     Русский Rules