Similar presentations:
Гетероскедастичность
1. Гетероскедастичность
2. ОПРЕДЕЛЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ
Гетероскедастичность – это неоднородностьнаблюдений. Она характеризуется тем, что не
выполняется предпосылка 20 использования МНК:
2 . D[ ] const
0
2
Выполнимость предпосылки 20 называется
гомоскедастичностью.
2
3. ИЛЛЮСТРАЦИЯ ГЕТЕРОСКЕДАСТИЧНОСТИ
34. ГЕТЕРОСКЕДАСТИЧНОСТЬ ОШИБОК
2Причиной непостоянства дисперсии
эконометрической модели часто является ее зависимость
от масштаба рассматриваемых явлений.
В модель ошибка входит как аддитивное слагаемое.
В то же время часто она имеет относительный
характер и определяется по отношению к
измеренному уровню рассматриваемых факторов.
4
5. Примеры моделей с гетероскедастичным случайным членом
а)б)
в)
а) Дисперсия 2 растет по мере увеличения значений
объясняющей переменной X
б) Дисперсия 2 имеет наибольшие значения при средних
значениях X, уменьшаясь по мере приближения к крайним
значениям
в) Дисперсия ошибки наибольшая при малых значениях X,
быстро уменьшается и становится однородной по мере
увеличения X
5
6. ИСТИННАЯ И ЛОЖНАЯ ГЕТЕРОСКЕДАСТИЧНОСТЬ
1. Истинная гетероскедастичностьВызывается непостоянством дисперсии случайного
члена, ее зависимостью от различных факторов.
2. Ложная гетероскедастичность
Вызывается ошибочной спецификацией
модели регрессии.
6
7. Источники гетероскедастичности – 1
Истинная гетероскедастичность возникает вперекрестных выборках при зависимости
масштаба изменений зависимой переменной
от некоторой переменной, называемой
фактором пропорциональности (Z).
7
8. Источники гетероскедастичности – 1
Наиболее распространенный случай истиннойгетероскедастичности – 1: дисперсия растет с
ростом одного из факторов.
8
9. Источники гетероскедастичности – 2
Истинная гетероскедастичность возникает также иво временных рядах, когда зависимая переменная
имеет большой интервал качественно
неоднородных значений или высокий темп
изменения (инфляция, технологические сдвиги,
изменения в законодательстве, потребительские
предпочтения и т.д.).
9
10. Гетероскедастичность простейшего вида
Мы в дальнейшем будем рассматривать, главнымобразом, только гетероскедастичность простейшего
вида:
Var( i ) Z
2
i
2
i
10
11. СЛЕДСТВИЯ ГЕТЕРОСКЕДАСТИЧНОСТИ
1. Истинная гетероскедастичность не приводит ксмещению оценок коэффициентов регрессии
2. Стандартные ошибки коэффициентов
(вычисленные в предположении.
гомоскедастичности) будут занижены. Это
приведет к завышению t-статистик и даст
неправильное (завышенное) представление о
точности оценок.
11
12. ОБНАРУЖЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ
Обнаружение гетероскедастичности в каждом конкретномслучае – довольно сложная задача.
2
Для знания i необходимо знать распределение случайной
величины Y/X=xi . На практике часто для каждого
конкретного значения xi известно лишь одно yi, что не
позволяет оценить дисперсию случайной величины Y/X=xi.
Не существует какого-либо
однозначного метода определения
гетероскедастичности.
12
13. ОБНАРУЖЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ
Тесты:1. Тест ранговой корреляции Спирмена.
2. Тест Парка.
3. Тест Глейзера.
4. Тест Голдфелда-Квандта.
5. Тест Уайта.
6. Тест Бреуша-Пагана.
13
14. ТЕСТ РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА
При использовании данного тестапредполагается, что дисперсии отклонений
остатков будут монотонно изменятьcя
(увеличиваться или уменьшаться) с увеличением
фактора пропорциональности Z.
Поэтому значения ei и zi будут
коррелированы (возможно, нелинейно!).
14
15. ТЕСТ РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА. Алгоритм применения
1. Рассчитываются ранги (порядковые номера)значений фактора пропорциональности zi = xik.
2. Рассчитывается уравнение
m
y i b0 b j xij
j 1
и вычисляются остатки ei yi y i , i 1,.n
3. Рассчитываются ранги остатков ei.
15
16. ТЕСТ РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА. Алгоритм применения
4. Рассчитывается коэффициент ранговой корреляцииСпирмена
z / e 1
6 D
2
i
, Di – разность рангов z и e.
n(n 1)
2
5. Рассчитывают статистику u z / e n , 1
распределенную нормально N(0,1) при отсутствии
гетероскедастичности.
16
17. ТЕСТ ПАРКА
Здесь предполагается, что дисперсии i связаныс фактором пропорциональности Z в виде:
2
2 i
i
z e
2
i
ln
ln i ln ln zi i
2
2
Т.к. дисперсии i неизвестны, то их заменяют
оценками квадратов отклонений ei2.
2
17
18. ТЕСТ ПАРКА. Алгоритм применения
m1. Строится уравнение регрессии: y i b0 b j xij
j 1
и вычисляются остатки ei yi y i , i 1, .n
2. Выбирается фактор пропорциональности Z и
оценивают вспомогательное уравнение регрессии:
ln( e ) 0 1 ln zi i , i 1, n
2
i
3. Проверяют значимость коэффициента при ln zi
18
19. ТЕСТ ГЛЕЙЗЕРА
Здесь предполагается, что дисперсии i связаныс фактором пропорциональности Z в виде:
2
zi i
i
Т.к. средние квадратические отклонения i
неизвестны, то их заменяют модулями оценок
отклонений ei .
19
20. ТЕСТ ГЛЕЙЗЕРА. Алгоритм применения
m1. Строится уравнение регрессии: y i b0 b j xij
j 1
и вычисляются остатки ei yi y i , i 1., n
2. Выбирается фактор пропорциональности Z и оценивают
вспомогательное уравнение регрессии: ei 0 1zi i , i 1, n
Изменяя , строят несколько моделей: , 1, 0,5, 0,5,1,
3. Статистическая значимость коэффициента 1 в каждом случае
означает наличие гетероскедастичности.
4. Если для нескольких моделей будет получена значимая
оценка 1 , то характер гетероскедастичности определяют по
наиболее значимой из них.
20
21. ТЕСТЫ ПАРКА и ГЛЕЙЗЕРА. Выводы
Отметим, что как в тесте Парка, так и в тестеГлейзера для отклонений i может нарушаться
условие гомоскедастичности.
Однако, во многих случаях используемые в
тестах модели являются достаточно хорошими
для определения гетероскедастичности.
21
22. ТЕСТ БРЕУШ-ПАГАНА
Тест применим в предположении, что:Дисперсии зависят от некоторых
i
дополнительных переменных Z j , j 1, p :
2
p
0 j Zij , i 1, n
2
i
j 1
22
23. ТЕСТ БРЕУШ-ПАГАНА. Алгоритм применения
1. Строится уравнение регрессии: y i b0m
b x
j 1
j ij
и вычисляются остатки: ei yi y i , i 1, n
2. Вычисляют оценку дисперсии остатков:
~e2
2
e
i
n
3. Строят вспомогательное уравнение регрессии:
p
ei2
0 j z ji i , i 1, n
2
~
e
j 1
23
24. ТЕСТ БРЕУШ-ПАГАНА. Алгоритм применения
4. Для вспомогательного уравнения регрессии определяютобъясненную часть вариации RSS.
5. Находим тестовую статистику:
RSS
BP
2
6. Если верна гипотеза H0: гомоскедастичность остатков, то
статистика BP имеет распределение 2 . Т.е. о наличии
p
гетероскедастичности остатков на уровне значимости
свидетельствует:
2
BP ; p
24
25. ТЕСТ БРЕУШ-ПАГАНА. Замечания
p 1При
гетероскедастичность может быть
скорректирована:
m
y i b0 b j xij
j 1
При
xij
b0 m
yi
bj
zi1 j 1 zi1
p 1 не существует естественного
преобразования, корректирующего гетероскедастичность
25
26. ТЕСТ ГОЛДФЕЛДА-КВАНДТА
В этом тесте предполагается:1. Стандартные отклонения остатков i
пропорциональны фактору пропорциональности
Z, т.е.
2
2 2
i
i
z , i 1, n
2. Случайный член имеет нормальное
распределение и отсутствует автокорреляция
остатков (предпосылка 30).
26
27. ТЕСТ ГОЛДФЕЛДА-КВАНДТА. Алгоритм применения
1. Выделяют фактор пропорциональности Z = Xk.Данные упорядочиваются в порядке возрастания
величины Z.
2. Отбрасывают среднюю треть упорядоченных
наблюдений. Для первой и последней третей
строятся две отдельные регрессии, используя ту же
спецификацию модели регрессии.
3. Количество наблюдений в этих подвыборках
должно быть одинаково. Обозначим его l.
27
28. ТЕСТ ГОЛДФЕЛДА-КВАНДТА. Алгоритм применения
4. Берутся суммы квадратов остатков для регрессий попервой трети RSS1 и последней трети RSS3. Рассчитывают
их отношение:
RSS 3
GQ
RSS1
5. Используем F-тест для проверки гомоскедастичности.
Если статистика GQ удовлетворяет неравенству
GQ F ; l m 1; l m 1
то гипотеза гомоскедастичности остатков отвергается на
уровне значимости .
28
29. ТЕСТ ГОЛДФЕЛДА-КВАНДТА. Замечание
Тест Голдфелда-Квандта применим и для случаяобратной пропорциональности:
2
i
2
2
i
z
, i 1, n
При этом используется та же процедура, но тестовая
статистика равна:
RSS1
GQ
RSS 3
29
30. ТЕСТ УАЙТА
Предполагается, что дисперсии i связаныс объясняющими переменными X j , j 1, m в виде:
2
f ( X i1, X i 2 , , X im ) i , i 1, n
2
i
где f( ) – квадратичная функция от аргументов.
Т.к. дисперсии i неизвестны, то их заменяют
оценками квадратов отклонений ei2.
2
30
31. ТЕСТ УАЙТА. Алгоритм применения (на примере трех переменных)
1. Строится уравнение регрессии:y i b0 b1 xi1 b2 xi 2 b3 xi 3
и вычисляются остатки
ei yi y i , i 1,. n
2. Оценивают вспомогательное уравнение регрессии:
ei2 0 1 X i1 2 X i 2 3 X i 3 4 X i21 5 X i22
6 X 7 X i1 X i 2 8 X i1 X i 3 9 X i 2 X i 3 i
2
i3
31
32. ТЕСТ УАЙТА. Алгоритм применения (на примере трех переменных)
3. Определяют из вспомогательного уравнения тестовуюстатистику U nR 2
4. Проверяют общую значимость уравнения с помощью
критерия 2. Если
2
; k
U
то гипотеза гомоскедастичности отвергается. Число
степеней свободы k равно числу объясняющих
Переменных вспомогательного уравнения. В частности,
Для рассматриваемого случая k = 9.
32
33. ТЕСТ УАЙТА. Замечания
Тест Уайта является более общим чем тестГолдфелда-Квандта.
Неудобство использования теста Уайта:
Если отвергается нулевая гипотеза о наличии
гомоскедастичности
H0 : ,
2
1
2
2
то неясно, что делать дальше.
2
n
33
34. КОРРЕКЦИЯ ГЕТЕРОСКЕДАСТИЧНОСТИ
1. Использовать обобщенный метод наименьшихквадратов.
2. Переопределить переменные.
3. Вычисление стандартных ошибок с поправкой на
гетероскедастичность (метод Уайта).
34
35. ОБОБЩЕННЫЙ МЕТОД НАИМЕНЬШИХ КВАДРАТОВ
При нарушении гомоскедастичности и наличии автокорреляцииостатков рекомендуется вместо традиционного МНК
использовать обобщенный МНК. Его для случая устранения
гетероскедастичности часто называют методом взвешенных
наименьших квадратов.
Метод применим, если известны дисперсии
наблюдения.
2
для каждого
i
Основан на делении каждого наблюдаемого значения на
соответствующее ему стандартное отклонение остатков.
35
36. МЕТОД ВЗВЕШЕННЫХ НАИМЕНЬШИХ КВАДРАТОВ. Случай парной регрессии
Yi 0 1 X i i1
Xi
Yi
i
Yi ,
Zi ,
X ,
i
i
i
i
i
Yi
i
0 1
i
i
i i
i
i
1
Xi
Yi 0 Z i 1 X i i
Получили уравнение регрессии без свободного члена, но с
дополнительной объясняющей переменной Z и с
«преобразованным» остатком . Можно показать, что для
него выполняются предпосылки 10 – 50 МНК.
36
37. МЕТОД ВЗВЕШЕННЫХ НАИМЕНЬШИХ КВАДРАТОВ. Случай парной регрессии
На практике, значения дисперсии остатков, какправило, не известны. Для применения метода ВНК
необходимо сделать реалистичные предположения об этих
значениях. Например:
2
Дисперсии
i
Дисперсии
2
i
пропорциональны Xi:
пропорциональны
Xi2:
2 2 xi , i 1, n
i
2 2 xi2 , i 1, n
i
37