ПРОВЕРКА ГИПОТЕЗ и ДА
Цели
Независимая переменная имеет больше двух уровней
Независимая переменная имеет больше двух уровней
Независимая переменная имеет больше двух уровней
Независимая переменная имеет больше двух уровней
Независимая переменная имеет больше двух уровней
Независимая переменная имеет больше двух уровней
Основы дисперсионного анализа
Основы дисперсионного анализа
Основы дисперсионного анализа
Основы дисперсионного анализа
Понятие о сумме квадратов
Понятие о сумме квадратов
Понятие о сумме квадратов
Понятие о сумме квадратов
Понятие о сумме квадратов
Понятие о сумме квадратов
Понятие о сумме квадратов
Понятие о сумме квадратов
Получение оценок дисперсий
Получение оценок дисперсий
Получение оценок дисперсий
Получение оценок дисперсий
Получение оценок дисперсий
Основы дисперсионного анализа
Основы дисперсионного анализа
Основы дисперсионного анализа
Основы дисперсионного анализа
Основы дисперсионного анализа
Основы дисперсионного анализа
Апостериорные критерии
Апостериорные критерии
Апостериорные критерии
Апостериорные критерии
Апостериорные критерии
Апостериорные критерии
Апостериорные критерии
Апостериорные критерии
Апостериорные критерии
Апостериорные критерии
Апостериорные критерии
Апостериорные критерии
Правда и неправда о ДА
Правда и неправда о ДА
Самостоятельная работа
Исследование с несколькими НП
Исследование с несколькими НП
Исследование с несколькими НП
Исследование с несколькими НП
Исследование с несколькими НП
Исследование с несколькими НП
Исследование с несколькими НП
Исследование с несколькими НП
Исследование с несколькими НП
Исследование с несколькими НП
Исследование с несколькими НП
Стой, Подумай, Примени
Стой, Подумай, Примени
Стой, Подумай, Примени
Стой, Подумай, Примени
Стой, Подумай, Примени
Стой, Подумай, Примени
Стой, Подумай, Примени
Стой, Подумай, Примени
Стой, Подумай, Примени
Стой, Подумай, Примени
Стой, Подумай, Примени
Самостоятельная работа
Многомерный ДА
1.12M
Category: mathematicsmathematics

Проверка гипотез. Основы ДА

1. ПРОВЕРКА ГИПОТЕЗ и ДА

Cтат. методы в
психологии
(Радчикова Н.П.)
Trisha Klass Illinois State University

2. Цели

Что делать, если независимая переменная
имеет больше двух уровней?
Что делать, если в эксперименте более
одной независимой переменной?
Что делать, если в эксперименте более
одной зависимой переменной?

3. Независимая переменная имеет больше двух уровней

Действительно ли холерики и сангвиники более
агрессивны, чем флегматики и меланхолики?
30
25
20
15
агрессивность
10
5
0
Х
С
Ф
М

4. Независимая переменная имеет больше двух уровней

Нашей задачей является избегание
ошибки I рода.
Если мы примем уровень
статистической значимости равным
0,05, мы согласимся принять риск
ошибиться в 5 случаях из 100. Когда
происходит много сравнений, этот риск
увеличивается.

5. Независимая переменная имеет больше двух уровней

6 сравнений:
Вероятность сделать ошибку при каждом
сравнении примем за 0,05.
Тогда вероятность не сделать ошибку
1-0,05=0,95.

6. Независимая переменная имеет больше двух уровней

Вероятность не сделать ошибку во всех 6
сравнениях
(0,95)6=0,74.
А вероятность допустить ошибку хотя бы
в одном сравнении равна
1-0,74=0,26 !

7. Независимая переменная имеет больше двух уровней

Для 10 сравнений вероятность
сделать по крайней мере одну
ошибку равна 0,40,
для 20 сравнений – уже 0,64!!!

8. Независимая переменная имеет больше двух уровней

Что делать?
Применять
специальные
критерии!

9. Основы дисперсионного анализа

В качестве такого критерия для
параметрических данных используется
ДИСПЕРСИОННЫЙ АНАЛИЗ

10. Основы дисперсионного анализа

Дисперсионный анализ – это процедура,
которая позволяет сравнивать средние
значения нескольких групп, предоставляя
единственное решение на определенном
уровне статистической значимости.
Дисперсионный анализ позволяет ответить
на вопрос: «Значимо ли различаются
средние значения зависимой переменной
при разных уровнях независимой
переменной?»

11. Основы дисперсионного анализа

Дисперсионный анализ иногда в
литературе называется ANOVA (от
английского ANalysis Of VAriance).
Несмотря на такое название в
дисперсионном анализе сравниваются не
дисперсии, а средние значения.

12. Основы дисперсионного анализа

Рассмотрим идеи однофакторного
дисперсионного анализа на примере для
несвязных выборок.
В этом случае группы, которые мы
сравниваем, представляют различные
уровни (значения) одной независимой
переменной (или фактора).
Фактор и независимая переменная
являются в данном случае синонимами.

13. Понятие о сумме квадратов

Предположим,
что мы
провели
ЛЕВШИ
ПРАВШИ
исследование, где две группы
1
6
испытуемых,
различающихся
по
доминантной руке (левши и правши),
2
7
оценивали, насколько удобно им
пользоваться
компьютером.
5
9
Высокий
набранный
балл
Проверим
о том,
что нет
8 гипотезу
10
свидетельствует
о большем
зависимости
оценки
удобстваудобстве.
работы на
компьютере от доминантной руки.

14. Понятие о сумме квадратов

ЛЕВШИ
ПРАВШИ
1
6
2
7
5
9
8
10
ХЛЕВ 4
Х ПР АВ 8
Х ОБЩ 6

15. Понятие о сумме квадратов

Теперь, если мы вычтем общее
среднее из каждого показателя и
возведем эту разность в квадрат, то
получим общую сумму квадратов
SSобщ (SS – sum of squares)
SSОБЩ = (1-6)2+(2-6)2+(5-6)2+(8-6)2+
+(6-6)2+(7-6)2+(8-6)2+(10-6)2=72

16. Понятие о сумме квадратов

Внутригрупповая сумма квадратов –
это сумма сумм квадратов,
полученных для каждой группы.
Внутригрупповая сумма квадратов
является мерой изменчивости внутри
групп.

17. Понятие о сумме квадратов

12
10
удобство (балл)
Источником внутригрупповой
8
изменчивости являются все
переменные,
влияющие на
6
зависимую переменную, кроме
4
нашей независимой переменной
2
0
ЛЕВШИ
ПРАВШИ

18. Понятие о сумме квадратов

Внутригрупповая сумма квадратов =
сумма квадратов группы 1 плюс сумма
квадратов группы 2.
SSВ/Г=SSЛЕВ+SSПРАВ
SSВ / Г ( X - X ЛЕВ ) ( X - XПРАВ )
2
2
SSВ / Г (1 4)2 (2 4)2 (5 4)2 (8 4)2 (6 8)2 (7 8)2 (9 8)2 (10 8)2
SS В / Г 40

19. Понятие о сумме квадратов

Межгрупповая сумма квадратов – это
сумма квадратов отклонений между
группами.
Она
отражает
влияние
независимой переменной и может быть
получена как сумма квадратов разностей
общего среднего и среднего значения,
умноженного на число испытуемых в
каждой группе:
SSМ / Г Ni ( Xi - XОБЩ )
2
SSМ / Г 4(4 6)2 4(8 6)2 32

20. Понятие о сумме квадратов

Внутригрупповая сумма
Межгрупповая сумма
квадратов
- мера
квадратов – мера
дисперсии
Общая
сумма квадратов
равна
дисперсии данных внутри
данных между группами,
внутригрупповой
сумме
квадратов
каждой группы, и,
представляет собой
плюс
сумме
следовательно,
не межгрупповой
может
дисперсию,
которую вносит
объясняться независимой
независимая переменная
квадратов:
переменной
SSОБЩ SSВ / Г SSМ / Г

21. Получение оценок дисперсий

Значимость разницы между этими
двумя оценками дисперсии
(суммами квадратов) определяется
с помощью F-распределения
Фишера.

22. Получение оценок дисперсий

•Если межгрупповая дисперсия (т.е.
разница между средними групп) велика
относительно внутригрупповой
дисперсии, число F достаточно велико.
•Если межгрупповая дисперсия мала
относительно внутригрупповой
дисперсии, число F достаточно мало.

23. Получение оценок дисперсий

Таким образом, проверка нульгипотезы требует вычисления
отношения межгрупповой и
внутригрупповой сумм квадратов.
Но! Оба значения растут с ростом
размера выборки. Поэтому следует
делить обе суммы квадратов на
соответствующие степени свободы.

24. Получение оценок дисперсий

Степени свободы для межгрупповой суммы
квадратов – что число групп минус 1:
dfМ/Г=k-1
В нашем случае k=2, dfМ/Г =2-1=1
Следовательно, средняя сумма квадратов
MSМ/Г (mean square):
MS М / Г
SS М / Г
df М / Г
32
32;
1
df 1

25. Получение оценок дисперсий

Степени свободы для внутригрупповой
суммы квадратов – это общее число
испытуемых минус число групп (уровней
независимой переменной)
DfВ/Г=N-k=8-2=6
MSВ / Г
SS В / Г
df В / Г
40
6,67;
6
df 6

26. Основы дисперсионного анализа

F
МS М / Г
MS В / Г
32
F
4,80;
6,67
df 1, 6

27. Основы дисперсионного анализа

df2 df1 1
1
161,45
2
18,51
3
10,13
4
7,71

6
5,99
7
5,59
2
199,50
19,00
9,55
6,94
3
215,72
19,16
9,28
6,59
4
224,57
19,25
9,28
6,39
5,14
4,74
4,76
4,35
4,53
4,12

28. Основы дисперсионного анализа

Fэмп<Fкр
Следовательно, нельзя
отвергнуть нуль-гипотезу об
одинаковом уровне удобства
пользования компьютером для
левшей и правшей: и те, и другие
чувствуют себя за клавиатурой
одинаково

29. Основы дисперсионного анализа

Межгрупповая сумма
квадратов
Внутригрупповая
сумма квадратов

30. Основы дисперсионного анализа

Ограничения и предположения ДА
•дисперсии в сравниваемых группах должны
быть приблизительно равны
•выборки
должны
независимы
быть
случайны
и
•зависимая переменная должна быть, по
крайней мере, интервальной, и нормально
распределена в каждой группе.

31. Основы дисперсионного анализа

Действительно ли холерики и сангвиники более
агрессивны, чем флегматики и меланхолики?
30
25
20
15
агрессивность
10
5
0
Х
С
Ф
М
F(3,342)=12,87; p<0,001

32. Апостериорные критерии

Пример для трех групп
ПРАВШИ
ЛЕВШИ
БЕЗРУКИЕ
12
4
1
8
10
5
5
4
3
3
4
6
7
9
14
6
10
1
8
5
3
9
4
8
5
2
2

33. Апостериорные критерии

SSОБЩ 291,41
SSМГ
(78) 2 ( 46) 2 ( 43) 2 (158) 2
114,96
9
9
9
27
SSВ / Г SSОБЩ SSМ / Г 291,41 114,96 176,45

34. Апостериорные критерии

dfМ / Г k 1 2
dfВ / Г N k 24
MSМ / Г
MSВ / Г
114,96
57,48
2
176,45
7,35
24

35. Апостериорные критерии

FЭМП
57,48
7,82
7,35
FКР 3,40
df 2,24

36. Апостериорные критерии

H0: 1= 2
H0: 1= 3
H0: 3= 2

37. Апостериорные критерии

Критерий Тьюки (Tukey) – HSD
(honestly significant difference)
HSD q
MS В / г
N
N – число человек в группе
q - значение из специальной таблицы
для уровня значимости , числа
сравнений k и dfв/г

38. Апостериорные критерии

Считаем таблицу разниц между
средними групп
X1
X1 5,11
X1 5,11
0
X2 8,67 …
X3 3,18

X2
X2 8,67
X3
X3 3,78
3,56
1,33
0
4,89

0

39. Апостериорные критерии

dfв/г
5
6
7
8

24

k
2
3,64
3,46
3,34
3,26
3
4,60
4,34
4,16
4,04
4
5,22
4,90
4,68
4,53


2,92

3,53
3,90

q для =0,05

40. Апостериорные критерии

Критерий Тьюки (Tukey) – HSD
(honestly significant difference)
N =9
q =3,53
MSВ / Г 7,35
HSD q
MSВ / г
7,35
3,53
3,18
N
9

41. Апостериорные критерии

HSD=3,18
X1
X1 5,11
X1 5,11 0
X2 8,67 …
X3 3,18 …
X2
X2 8,67
3,56
0

X3
X3 3,78
1,33
4,89
0

42. Апостериорные критерии

HSD=3,18
X1
X1 5,11
X2
X2 8,67
X3
X3 3,18
p<0,05
н.з.
p<0,05
X1 5,11 0
X2 8,67 …
X3 3,18 …
0

0

43. Апостериорные критерии

44. Правда и неправда о ДА

Дисперсионный анализ
НЕ
показывает причину!
И никаким образом не
помогает выяснить, что
является причиной, а что –
следствием!

45. Правда и неправда о ДА

140
130
120
110
100
90
80
70
60
50
F(2,456)=33,78; p<0,0001
Разве
IQ
интеллект
зависит от
оценок?!!
отличники
хорошисты
двоечники

46. Самостоятельная работа

К следующему занятию прочитать:
Радчикова Н.П. Объем памяти и размер
алфавита…// ПЖ, том 29, № 4, 2008. – с.
105-112
(есть в электронном виде)

47. Исследование с несколькими НП

Эффект одной независимой переменной
в сложном (факторном) эксперименте
называется главным эффектом (main
effect).
Он показывает, имеется ли эффект от
воздействия данного отдельно взятого
фактора.

48. Исследование с несколькими НП

Взаимодействие это количественный
результат, обусловленный соотношением
между действием двух или нескольких
независимых переменных, выделенный в
факторном эксперименте. Вычисляется как
разность между различиями значений
зависимой переменной, полученных при
действии разных условий первой, второй и т.
д. переменных, и иллюстрируется
графически.

49. Исследование с несколькими НП

Взаимодействие показывает, зависит
ли величина воздействия фактора от
значений других факторов
(переменных).

50. Исследование с несколькими НП

Нельзя интерпретировать
результаты исследования, не
принимая во внимание
взаимодействие!

51. Исследование с несколькими НП

Пример.
Психолог провел тренинг развития
эмпатии для группы студентов,
состоявшей из юношей и девушек.
Эмпатия измерялась до и после тренинга,
и психологу интересно узнать, как повлиял
тренинг на развитие этого качества.

52. Исследование с несколькими НП

В этом исследовании были выбраны две
независимые переменные:
1) пол испытуемых (имеет два уровня юноши
и девушки) и
2) условия измерения эмпатии (имеет два
уровня до тренинга и после тренинга).
Зависимой переменной являлся уровень эмпатии
(чем больше балл, набранный по некоторому
тесту, тем больше уровень эмпатии).

53. Исследование с несколькими НП

урове нь эмпатии
уровень эмпатии
Исследование с несколькими НП
юноши
девушки
до тренинга
Главные эффекты
после тренинга

54. Исследование с несколькими НП

уровень эмпатии
Исследование с несколькими НП
до тренинга
после тренинга
юноши
девушки
Взаимодействие

55. Исследование с несколькими НП

Главные эффекты статистически
независимы от эффектов
взаимодействия, поэтому нельзя
предсказать, какое будет
взаимодействие, зная только главные
эффекты.

56. Исследование с несколькими НП

Для оценки значимости главных
эффектор и значимости
взаимодействия служит
многофакторный дисперсионный
анализ.
Этот метод не имеет
непараметрических аналогов – его
нельзя заменить другими
статистическими методами.

57. Исследование с несколькими НП

58. Стой, Подумай, Примени

Исследователь провел эксперимент, чтобы
определить влияние марихуаны на реакцию
человека. У группы испытуемых сначала
измерялась базовая скорость реакции, затем
измерялась скорость реакции после того, как
они выкурили сигарету с марихуаной, а для
того, чтобы проверить, как долго длится
действие наркотика, скорость реакции была
измерена еще раз на следующий день

59. Стой, Подумай, Примени

Исследователь собрал следующие данные о
восприятии сцен ужаса (чем больше балл, тем
сильнее неприятные ощущения) в двух группах
испытуемых. Одна группа смотрела только
сцены ужаса, а другой сначала
демонстрировали юмористические сцены.

60. Стой, Подумай, Примени

Студент-психолог измерил тревожность в двух
классах – спортивном и обычном (чем больше
балл, тем больше тревожность). Проверьте с
помощью подходящего критерия гипотезу
студента о том, что спортивный класс обладает
меньшей тревожностью.

61. Стой, Подумай, Примени

Студент для курсового проекта проверяет, есть
ли разница между «совами», «жаворонками» и
«дроздами» во времени реакции рано утром.

62. Стой, Подумай, Примени

Школьный психолог проверяет гипотезу о том,
что девочки с высоким социальным статусом
проявляют более высокую личностную
тревожность, чем их сверстницы, а у мальчиков
такой зависимости не наблюдается.

63. Стой, Подумай, Примени

Студент-дипломник решил посмотреть, как
изменяется агрессивность учеников с возрастом.
Для этого он измерил агрессивность в 1-х, 4-х, 7-х
и 11-х классах. Но руководитель проекта
забраковал такой диплом, указав, что
агрессивность может существенно отличаться у
девочек и мальчиков. К счастью на каждой
анкете был указан пол ученика. Какой
статистический критерий следует применить
нашему студенту и почему?

64. Стой, Подумай, Примени

Исследователь интересуется, зависит ли
креативность ребенка от условий, в которых он
воспитывается. В частности, он решил
проверить, как влияет состав семьи на
креативность. Было обследовано 150 детей из
разного типа семей (полная, неполная, детский
дом).

65. Стой, Подумай, Примени

Студент Недотепкин для курсового проекта
выдвинул гипотезу о том, что школьная
тревожность зависит от статуса ученика в классе.
Он провел в одном классе 2 теста - один для
определения статуса и другой для определения
школьной тревожности.

66. Стой, Подумай, Примени

В некотором эксперименте одной группе
испытуемых надо было прочитать список слов, а
другой - назвать рисунки, которые были
подобраны так, чтобы названия совпадали со
словами из списка. Исследователь измерил время
(сек), которое понадобилось испытуемым для
выполнения заданий.

67. Стой, Подумай, Примени

Изучались способности к различным
математическим вычислениям у детей младшего
школьного возраста из семей со средним и
низким достатком. Было обнаружено, что дети из
семей со средним достатком лучше выполняли
задания, если их формулировали устно, при этом
обе группы одинаково успешно справлялись с
невербальными заданиями.

68. Стой, Подумай, Примени

Три группы дошкольников участвуют в исследовании,
посвященном изучению настойчивости при
выполнении заданий, в котором варьируется время до
получения вознаграждения. Детям во всех трех
группах раздали трудные головоломки и попросили
собирать их, пока не надоест. Одной группе сказали,
что по окончании работы все получат по 5 долларов.
Вторая группа получит 5 долларов через 2 дня после
окончания эксперимента, третья – через 4 дня.

69. Самостоятельная работа

К практическому занятию по ДА надо
прочитать:
• Высоков И.Е. Базовые и стратегические
процессы распознавания семантических
отношений // ПЖ, 2004, т.25, № 5, с. 96-103

70.

СПАСИБО ЗА ВНИМАНИЕ!

71. Многомерный ДА

Используется тогда, когда мы хотим
проанализировать влияние НП сразу
на несколько ЗП
Часто называется MANOVA
Multivariate Analysis of Variance
English     Русский Rules