Similar presentations:
Двухфакторный дисперсионный анализ
1. Лекция 11. Двухфакторный дисперсионный анализ
11-1. Описание метода и пример11-2. Анализ взаимодействия
11-3. Решение в SPSS
22 августа 2017 г.
2. Пример
Компания хочет проверить эффективность своей рекламы.Выбран продукт, и созданы два типа рекламных роликов:
серьезный и смешной. Реклама размещена в рабочие и
выходные дни. Выбраны 16 потенциальных клиентов и наугад
распределены на 4 группы. После того, как каждый покупатель
просмотрел ролик, его просят оценить эффективность рекламы
по двадцатибалльной шкале. Различные баллы даются за
привлекательность, ясность, краткость ролика и т.д.
Иванов О.В., 2005
2
3. Пример
При α = 0,01 проанализируйте данные, используя двустороннийдисперсионный анализ.
Тип ролика
Смешной
Серьезный
Иванов О.В., 2005
День
Рабочий
Выходной
6, 10, 11, 9
15, 18, 14, 16
8, 13, 12, 10
19, 20, 13, 17
3
4. Дисперсионный анализ (Analysis of Variance)
F-критерий, который мы использовали при сравнении дисперсий,может применяться для сравнения трех и более средних.
Этот метод называется дисперсионным анализом или в
англоязычной аббревиатуре ANOVA (Analysis of Variance).
F-критерий можно использовать при сравнении двух средних. Но
в этом случае он становится идентичным t-критерию.
Иванов О.В., 2005
4
5. Однофакторный и двухфакторный анализ
Дисперсионный анализ, который рассматривает только однупеременную называется однофакторным дисперсионным
анализом (One-Way ANOVA). Дисперсионный анализ может
также применяться в случае двух переменных - это
двухфакторный дисперсионный анализ (Two-Way ANOVA).
Фактор
Зависимая
переменная
Иванов О.В., 2005
Фактор А
Фактор B
Зависимая
переменная
5
6. 11-1. Двухфакторный дисперсионный анализ
Описание метода и пример22 августа 2017 г.
7. Постановка проблемы
При применении двухфакторного дисперсионного анализаисследователь
проверяет
влияние
двух
независимых
переменных (факторов) на зависимую переменную. Может быть
изучен также эффект взаимодействия двух переменных.
Фактор А
Фактор B
Зависимая
переменная
Иванов О.В., 2005
7
8. Эффект обработки и эффект взаимодействия
Исследуемые группы называют эффектами(treatment groups):
Группа 1: Смешной ролик, рабочий день
Группа 2: Смешной ролик, выходной день
Группа 3: Серьезный ролик, рабочий день
Группа 4: Серьезный ролик, выходной день
обработки
Зрители распределяются по группам случайным образом. Эта
схема 2×2, так как каждая переменная состоит из двух уровней,
или двух разных вариантов обработки.
Иванов О.В., 2005
8
9. Эффект обработки и эффект взаимодействия
Двухфакторныйдисперсионный
анализ
позволяет
исследователю проверить эффекты влияния типа ролика и типа
дня одновременно, а не по отдельности.
Кроме
этого,
исследователь
может
проверить
также
дополнительную гипотезу об эффекте взаимодействия между
двумя переменными. Наличие значимого эффекта будет
означать, что тип ролика по-разному влияет на эффективность
рекламы, в зависимости от типа дня.
Иванов О.В., 2005
9
10. Другие схемы
Двухфакторный дисперсионный анализ типа 3 х 2 и 3 х 3.В1
В2
В1
А1
А1
А2
А2
А3
А3
Иванов О.В., 2005
В2
В3
10
11. Гипотезы
Схемадвухфакторного
дисперсионного
анализа
имеет
несколько нулевых гипотез: одна для каждой независимой
переменной и одна для взаимодействия.
Н0: Тип ролика и день не имеют эффекта взаимодействия на
эффективность рекламы.
Н1: Тип ролика и день имеют эффект взаимодействия на
эффективность рекламы.
Н0: Эффективность рекламы не зависит от типа ролика.
Н1: Эффективность рекламы зависит от типа ролика.
Н0: Эффективность рекламы не зависит от типа дня.
Н1: Эффективность рекламы зависит от типа дня.
Иванов О.В., 2005
11
12. Таблица результатов
Результаты вычислений представляюттаблицы:
в виде
следующей
Сумма
квадратов
df
Среднее
квадратичное
F
Фактор A
SSA
a–1
MSA
FA
Фактор B
SSB
b–1
MSB
FB
Взаимодействие, AxB
SSAxB
(a – 1)(b – 1)
MSAxB
FAxB
Ошибка
SSerror
ab(n – 1)
MSerror
ИТОГО
…
…
...
Иванов О.В., 2005
12
13. Обозначения
SSA – сумма квадратов для фактора АSSB – сумма квадратов для фактора В
SSAxB – сумма квадратов для взаимодействия факторов
SSerror – сумма квадратов для ошибки
а – количество уровней фактора А
b – количество уровней фактора В
n – количество объектов в каждой группе
Иванов О.В., 2005
13
14. Изменчивость в двухфакторном анализе
Общаяизменчивость
Между группами
Между
столбцами
Между
строками
Внутри групп
Взаимодействие
SStotal SS colum n SS row SSint eraction SS within
Иванов О.В., 2005
14
15. Формулы для вычислений
SSвнутриSS A
SSB
SS A B
MS A
; MSB
; MS A B
; MSвнутри
a 1
b 1
(a 1)(b 1)
ab(n 1)
MS B
FB
MSвнутри
FA B
MS A B
MSвнутри
MS A
FA
MSвнутри
Иванов О.В., 2005
df.N. = b – 1
df.D. = ab(n – 1)
df.N. = (a – 1)(b – 1)
df.D. = ab(n – 1)
df.N. = a – 1
df.D. = ab(n – 1)
15
16. Условия применения
1. Генеральные совокупности, из которых извлечены выборки,должны быть нормально распределены.
2. Выборки должны быть независимыми.
3. Дисперсии
генеральных
совокупностей,
из
которых
извлекались выборки, должны быть равными.
4. Группы должны иметь одинаковый объем выборки.
Иванов О.В., 2005
16
17. Пример
Исследовательхочет
выяснить,
оказывают
ли
тип
потребляемого бензина и тип автомобиля влияние на расход
топлива. Для этого будут использованы два типа бензина –
обычный и высокооктановый, и для каждой группы будут
использованы два типа автомобилей – с двумя ведущими
колесами и с четырьмя. Для каждой группы будут использованы
по два автомобиля, всего восемь.
Тип автомобиля
Топливо
два колеса
четыре колеса
Обычное
26,7
25,2
28,6
29,3
Высокооктановое
32,3
32,8
26,1
24,2
Иванов О.В., 2005
Расход топлива
в милях на
галлон
17
18. Последовательность действий
ШАГ 1. Сформулировать гипотезы.ШАГ 2. Найти критическое значение для каждого значения Fкритерия при заданном α, например, α = 0,05.
ШАГ 3. Заполнить итоговую таблицу, чтобы получить значение
критерия.
ШАГ 4. Принять решение.
ШАГ 5. Подвести итоги.
Иванов О.В., 2005
18
19. Шаг 1. Сформулировать гипотезы
Гипотезы для взаимодействия:Н0: Тип топлива и тип автомобиля не оказывают эффекта взаимодействия на
потребление бензина.
Н1: Тип топлива и тип автомобиля оказывают эффекта взаимодействия на
потребление бензина.
Гипотезы для типов топлива:
Н0: Для двух типов топлива нет разницы между средним потреблением
бензина.
Н1: Для двух типов топлива существует разница между средним
потреблением бензина.
Гипотезы для типов автомобилей:
Н0: Для автомобилей с двумя и четырьмя ведущими колесами нет разницы в
среднем потреблении бензина.
Н1: Для автомобилей с двумя и четырьмя ведущими колесами существует
разница в среднем потреблении бензина.
Иванов О.В., 2005
19
20. Шаг 2. Критические значения для F-критерия
Каждая независимая переменная, или фактор, имеет два уровня(принимает два значения).
Фактор А - тип топлива: обычное и высокооктановое, а = 2.
Фактор В - тип автомобиля: также имеет два значения, b = 2.
Степени свободы для каждого фактора:
Фактор А:
df.N = a – 1 = 2 – 1 = 1
Фактор В:
df.N = b – 1 = 2 – 1 = 1
Взаимодействие (A×B): df.N = (a – 1)(b – 1) = (2 – 1)(2 – 1) = 1
Ошибка внутри группы: df.D = ab(n – 1) = 2×2(2 – 1) = 4
n – число объектов в каждой группе. В данном случае n = 2.
Иванов О.В., 2005
20
21. Шаг 2. Критические значения для F-критерия
Критические значения:FA
α = 0,05 df.N = 1 df.D = 4 FA = 7,71
FВ
α = 0,05 df.N = 1 df.D = 4 FВ = 7,71
FАхВ
α = 0,05 df.N = 1 df.D = 4 FАхВ =7,71
Иванов О.В., 2005
21
22. Замечание
Если факторы принимают различное числокритические значения не всегда будут одинаковыми.
значений,
Например, если фактор А имеет три значения, а фактор В –
четыре, и при этом в каждой группе по два объекта, то степени
свободы будут следующие:
df.N. = a – 1 = 3 – 1 = 2
df.N. = b – 1 = 4 – 1 = 3
df.N. = (a – 1)(b – 1) = (3 – 1)(4 – 1) = 6
df.D. = ab(n – 1) = 3×4(2 – 1) = 12
Иванов О.В., 2005
для фактора А
для фактора В
для фактора A×B
ошибка внутри группы
22
23. Шаг 3. Заполняем таблицу
Таблица результатов вычислений SSТопливо, А
Автомобиль, В
Взаимодействие, (А×В)
Ошибка внутри группы
Итого
Иванов О.В., 2005
df
MS
F
3,920
9,680
54,080
3,300
70,980
23
24. Шаг 3. Заполняем таблицу
SS A 3,920MS A
3,920
a 1 2 1
SS B 9, 680
MS B
9, 680
b 1 2 1
SS A B
54, 080
MS A B
54, 080
(a 1)(b 1) (2 1)(2 1)
MSвнутри
Иванов О.В., 2005
SSвнутри
3,300
3,300
0,825
ab(n 1) 2 2(2 1)
4
24
25. Шаг 3. Заполняем таблицу
MS A3,920
FA
4,753
MSвнутри 0,825
df.N. = a 1 1; df.D. ab(n 1) 4
MS B
9, 680
FB
11, 733
MSвнутри 0,825
df.N. b 1 1; df.D. ab(n 1) 4
FA B
MS A B
54,080
65,552
MSвнутри
0,825
df.N. (a 1)(b 1) 1; df .D. ab(n 1) 4
Иванов О.В., 2005
25
26. Шаг 3. Заполняем таблицу
Топливо, ААвтомобиль, В
Взаимодействие, (А×В)
Ошибка внутри группы
Итого
Иванов О.В., 2005
SS
3,920
9,680
54,080
3,300
70,980
df
1
1
1
4
7
MS
3,920
9,680
54,080
0,825
F
4,752
11,733
65,552
26
27. Шаг 3. Можем использовать SPSS
Tests of Between-Subjects EffectsDependent Variable: VAR00001
Source
Corrected Model
Intercept
VAR00002
VAR00003
VAR00002 * VAR00003
Error
Total
Corrected Total
Type III Sum
of Squares
67,680a
6339,380
9,680
3,920
54,080
3,300
6410,360
70,980
df
3
1
1
1
1
4
8
7
Mean Square
22,560
6339,380
9,680
3,920
54,080
,825
F
27,345
7684,097
11,733
4,752
65,552
Sig.
,004
,000
,027
,095
,001
a. R Squared = ,954 (Adjusted R Squared = ,919)
Иванов О.В., 2005
27
28. Шаг 4-5. Принять решение и подвести итог
Поскольку FB = 11,733 и FА×В = 65,522, что превышаеткритический уровень 7,71, нулевые гипотезы об эффекте
взаимодействия и о типе автомобиля отвергаются.
Итог. Поскольку нулевая гипотеза об эффекте взаимодействия
была отвергнута, можно сделать вывод о том, что сочетание
типа топлива и типа автомобиля оказывает существенное
влияние на потребление топлива.
Иванов О.В., 2005
28
29. Итоги
Подводя итоги, можно сказать, что двумерный дисперсионныйанализ является продолжением одномерного. Двумерный
анализ может использоваться для проверки воздействия двух
независимых
переменных
и
возможного
эффекта
взаимодействия на зависимую переменную.
Иванов О.В., 2005
29
30. 11-2. Анализ взаимодействия
МетодПример
22 августа 2017 г.
31. Интерпретация результатов анализа
В предыдущем примере влияние типа бензина и типаавтомобиля называются основными или главными эффектами.
Если нет значимого эффекта взаимодействия, основные
эффекты можно интерпретировать независимо друг от друга.
Однако, если существует значимый эффект взаимодействия,
надо более внимательно интерпретировать основные эффекты.
Чтобы
интерпретировать
результаты
двумерного
дисперсионного
анализа,
исследователи
предлагают
нарисовать график, на который наносятся средние значения
каждой
группы.
Затем
проанализировать
график
и
интерпретировать результаты.
Иванов О.В., 2005
31
32. Вычислим средние по группам
Тип автомобиляТопливо
два колеса
четыре колеса
Обычное
26, 7 25, 2
28, 6 29,3
X
25,95 X
28,95
2
2
Высокооктанов
ое
26,1 24, 2
32,3 32,8
25,15
X
32,55 X
2
2
Иванов О.В., 2005
32
33. Беспорядочное взаимодействие
3332
Высокооктановое
31
Обычное
30
29
28
27
26
25
24
2 колеса
Иванов О.В., 2005
4 колеса
На этом графике прямые пересекаются. В случае
такого пересечения и при значительном эффекте
взаимодействия, это взаимодействие называется
беспорядочным.
В случае беспорядочного взаимодействия не
следует интерпретировать основные эффекты без
учета эффекта взаимодействия.
33
34. Порядковое взаимодействие
28Высокооктановое
27
Обычное
26
25
24
2 колеса
Иванов О.В., 2005
4 колеса
Другой возможный тип взаимодействия –
порядковое взаимодействие.
Если значение F-критерия для взаимодействия
оказывается значимым и прямые не
пересекаются, тогда взаимодействие называется
порядковым, и основные эффекты можно
интерпретировать отдельно друг от друга.
34
35. Отсутствие взаимодействия
29Высокооктановое
28
Обычное
27
26
25
24
2 колеса
Иванов О.В., 2005
4 колеса
Наконец, когда нет значительного эффекта
взаимодействия, прямые на графике будут
параллельными или почти параллельными. В
подобной ситуации основные эффекты можно
интерпретировать независимо друг от друга,
поскольку не существует значимого
взаимодействия. На рисунке приведен график
двух переменных, когда эффект взаимодействия
незначителен, прямые параллельны.
35
36. Пример
2018
16
14
Смешной ролик
12
Серьезный ролик
10
8
Какой вывод можно сделать из этого
графика?
6
Рабочий день Выходной день
Иванов О.В., 2005
36
37. Отсутствие взаимодействия
2018
Смешной ролик
16
Серьезный ролик
14
12
10
8
6
Рабочий
Иванов О.В., 2005
Выходной
Поскольку прямые почти параллельны, не
существует значимого взаимодействия
между факторами. Основные эффекты
можно интерпретировать независимо друг от
друга.
37
38. Порядковое взаимодействие
2018
16
14
Смешной ролик
12
Серьезный ролик
10
8
6
Рабочий день Выходной день
Иванов О.В., 2005
38
39. Беспорядочное взаимодействие
2018
16
14
Смешной ролик
12
Серьезный ролик
10
8
6
Рабочий день Выходной день
Иванов О.В., 2005
39
40. 11-2. Решение задачи в SPSS
Ввод данныхАнализ
Отчет
22 августа 2017 г.
41. Ввод данных
Иванов О.В., 200541
42. Выбираем переменные
Grade является зависимойTrailer и Day независимые
Иванов О.В., 2005
42
43. Отчет
Tests of Between-Subjects EffectsDependent Variable: GRADE
Source
Model
DAY
TRAILER
DAY * TRAILER
Error
Total
Type III Sum
of Squares
2968,750a
175,563
10,563
6,250E-02
66,250
3035,000
df
4
1
1
1
12
16
Mean Square
742,188
175,563
10,563
6,250E-02
5,521
F
134,434
31,800
1,913
,011
Sig.
,000
,000
,192
,917
a. R Squared = ,978 (Adjusted R Squared = ,971)
Иванов О.В., 2005
43