Similar presentations:
Гетероскедастичность и ее последствия
1. ГЕТЕРОСКЕДАСТИЧНОСТЬ И ЕЕ ПОСЛЕДСТВИЯ
Cамарский государственный экономическийуниверситет
Кафедра математической статистики
ГЕТЕРОСКЕДАСТИЧНОСТЬ
И ЕЕ ПОСЛЕДСТВИЯ
Обнаружение гетероскедастичности.
Устранение гетероскедастичности.
Презентация лекции по курсу “Эконометрика”
доцента кафедры математической статистики
СГЭУ,
к.ф.-м.н., Ширяевой Людмилы Константиновны
E-mail: [email protected]
1
2. План
План• Гетероскедастичность и ее последствия
• Методы обнаружения гетероскедастичности.
• Методы устранения гетероскедастичности.
Обобщенный метод наименьших квадратов
Кафедра математической
статистики
2
3. Гетероскедастичность и ее последствия
Условия Гаусса-МарковаГетероскедастичность и ее
последствия
• Свойства эмпирических коэффициентов
регрессии напрямую зависят от свойств
случайной компоненты .
• Для получения статистически надежных
эмпирических коэффициентов регрессии
необходимо следить за выполнимостью условий
Гаусса-Маркова.
• При нарушении условий Гаусса-Маркова МНК
может давать эмпирические коэффициенты
регрессии с плохими статистическими
свойствами.
Кафедра математической
статистики
3
4. Гетероскедастичность и ее последствия
Второе условие Гаусса-МарковаГетероскедастичность и ее
последствия
Согласно второму условию ГауссаМаркова, дисперсия случайного
фактора должна быть одинаковой для
всех наблюдений, т.е. D(εi)= D(εj).
Выполнение этого условия называется
гомоскедастичностью, а его
нарушение - гетероскедастичностью.
Кафедра математической
статистики
4
5. Иллюстрация гомоскедастичности
Второе условие Гаусса-МарковаИллюстрация гомоскедастичности
Вероятность
того, что
случайная
ошибка
примет какое–либо
значение
одинакова
для всех
наблюдений
5
Кафедра математической статистики
6. Иллюстрация гетероскедастичности
Второе условие Гаусса-МарковаИллюстрация гетероскедастичности
Вероятность
того, что
случайная
ошибка
примет какоелибо значение
неодинакова
для всех
наблюдений
6
Кафедра математической статистики
7. Гомоскедастичность означает “одинаковый разброс”.
“гомоскедастичное”облако точек
Гомоскедастичность означает
“одинаковый разброс”.
Типичный вид
облака точек в
модели с
гомоскедастичным
и остатками
7
Кафедра математической статистики
8. Гетероскедастичность означает “неодинаковый разброс”.
“гетероскедастичное”облако точек
Гетероскедастичность означает
“неодинаковый разброс”.
Типичный вид облака
точек в модели с
гетероскедастичными
остатками
8
Кафедра математической статистики
9. Последствия применения МНК в случае гетероскедастичности
ПоследствияПоследствия применения МНК в
случае гетероскедастичности
МНК-оценки не будут являться
эффективными;
формулы для вычисления стандартных
ошибок коэффициентов регрессии
становятся некорректными;
дисперсия остатков регрессии
становится смещенной оценкой для
дисперсии случайной компоненты;
все выводы, получаемые на основе F – и
t -статистик, а также интервальные оценки
становятся ненадежными.
9
Кафедра математической статистики
10. Проверка остатков модели на гетероскедастичность
тестыПроверка остатков модели на
гетероскедастичность
Первичная проверка на наличие
гетероскедастичности осуществляется
с помощью визуального анализа
поведения остатков регрессии.
Дальнейшая проверка на наличие
гетероскедастичности осуществляется
уже с помощью статистических
тестов.
10
Кафедра математической статистики
11. Методы обнаружения гетероскедастичности
Видытестов
Тесты на гетероскедастичность
графический тест
графический анализ
остатков
тест
Спирмена
статистические тесты
тест
Квандта
тест
Глейзера
11
Кафедра математической статистики
12. Графический анализ остатков. Гетероскедастичность.
Графический тестГрафический анализ остатков.
Гетероскедастичность.
Если все отклонения
расположены внутри
расширяющейся или
наклонной полосы, то
это свидетельствует в
пользу
гетероскедастичности
12
Кафедра математической статистики
13. Графический анализ остатков. Гомоскедастичность.
Графический тестГрафический анализ остатков.
Гомоскедастичность.
• Если все отклонения
равномерно
заполняют некоторую
полосу постоянной
ширины, то это
свидетельствует в
пользу
гомоскедастичности.
13
Кафедра математической статистики
14. Сравнительный анализ статистических тестов
статистическиетесты
Наименование Основная идея теста
Статистика
Тест Спирмена
Проверка корелированности
остатков регрессии e и
значений X
t- статистика
Тест Квандта
Проверка значимости отличий F- статистика
ESS для верхней и нижней
третей упорядоченной
выборки
Подбор формы связи между t- статистика
остатками регрессии e и
и
значениями X
F- статистика
Тест Глейзера
14
Кафедра математической статистики
15. Общая схема проведения любого статистического теста
НапоминаниеОбщая схема проведения любого
статистического теста
Выдвижение нулевой гипотезы H 0
об отсутствии гетероскедастичности
Вычисление критического
Выбор Ê íàáë
тестовой статистики
K
Вычисление наблюдаемого
значения
значения K крит
K набл
Сравнивая
K набл
и K крит
осуществить принятие или отклонение H0
15
Кафедра математической статистики
16. Тест ранговой корреляции Спирмена
Тест СпирменаТест ранговой корреляции Спирмена
Тест Спирмена проверяет коррелированность модулей
остатков регрессии со значениями объясняющей переменной.
При использовании этого теста предполагается, что
дисперсия случайной ошибки либо уменьшается, либо
увеличивается по мере увеличения Х.
При этом точки (xi,ei) могут располагаться внутри либо
расширяющейся, либо – наклонной полосы (см. слайд 12 ).
Теснота взаимосвязи между модулями остатков регрессии
|ei| и значениями xi оценивается с помощью выборочного
рангового коэффициента корреляции rxe.
Если связь между абсолютными величинами остатков
регрессии и значениями может быть признана статистически
значимой, то принимается гипотеза о наличии
16
гетероскедастичности.
Кафедра математической статистики
17. Порядок выполнения теста Спирмена
Тест СпирменаПорядок выполнения теста Спирмена
1) выполняется регрессия переменной Y на переменную X,
2) для каждого i -ого наблюдения вычисляют модуль остатков регрессии
|ei|;
3) значения xi и модули |ei| ранжируются, т. е. упорядочиваются по
возрастанию;
4) вычисляются ранги – порядковые номера значений в ранжированном
ряде из значений xi, и ранги |ei| – порядковые номера значений в
ранжированном ряде, составленном из модулей остатков;
5) для каждого i-ого наблюдения вычисляется значение di как разность
между рангами xi, и |ei| (пусть, например, наблюдаемое значение
объясняющей переменной x11 является 33-им по величине, т.е. ранг x11
равен 33, а |e11| является 5-ым по величине, т.е. ранг |e11| равен 5,
тогда d11=33-5=28);
6) вычисляется выборочный коэффициент ранговой корреляции по
следующей формуле:
17
Кафедра математической статистики
18. Порядок выполнения теста Спирмена(окончание)
Тест Спирмена•7) выдвигаются нулевая и альтернативная гипотезы:
•H0 :(ранговый коэффициент корреляции для генеральной совокупности
rxe = 0, или гетероскедастичность отсутствует);
• H1 :(ранговый коэффициент корреляции для генеральной совокупности
rxe отличен от 0, или гетероскедастичность имеет место);
•8) cтатистика для проверки H0 имеет вид:
•9) строится двусторонняя критическая область
;
•10) если наблюдаемое значение t-статистики попадает в критическую
область, то принимается гипотеза о наличии гетероскедастичности; если
же наблюдаемое значение t-статистики попадает в область принятия
гипотезы, то принимается гипотеза о наличии гомоскедастичности.
•Замечание. Если в модели более одной объясняющей переменной, то с
помощью t-статистики проверка гипотезы может выполняться для
каждой из переменных отдельно..
18
Кафедра математической статистики
19. Тест Голдфелда-Квандта
Тест Голдфелда-Квандта•Тест Голдфелда-Квандта предполагает, что с ростом xi
•дисперсия D( i) либо растет, т.е.
•либо падает, т.е.
19
Кафедра математической статистики
20. Порядок выполнения теста Голдфелда-Квандта
Тест Голдфелда-КвандтаПорядок выполнения теста ГолдфелдаКвандта
1) все наблюдений упорядочиваются по величине
объясняющей переменной;
2) упорядоченная выборка разбивается на три
подвыборки объемом
;
3) средняя треть наблюдений отбрасывается и
оцениваются отдельные регрессии для верхней и
нижней подвыборок;
4) вычисляются дисперсии остатков регрессии для
верхней (
) и нижней ( ) подвыборок;
5) выдвигают основную гипотезу
H0 : модель является гомоскедастичной;
против альтернативной
H1 :модель является гетероскедастичной;
20
Кафедра математической статистики
21. Порядок выполнения теста Голдфелда-Квандта (окончание)
Тест Голдфелда-КвандтаПорядок выполнения теста
Голдфелда-Квандта (окончание)
•гипотеза H0 проверяется с помощью статистики:
:
•при выбранном уровне значимости строится
правосторонняя критическая область , описываемая
неравенством:
;
•вычисляется наблюдаемое значение F-критерия;
•далее следует выполнить проверку гипотезы H0 по
стандартной схеме.
21
Кафедра математической статистики
22. Тест Глейзера
Тест Глейзера• Тест Глейзера позволяет обнаружить
гетероскедастичность в случае, когда
стандартное отклонение случайной
компоненты связано со значением X
нелинейной зависимостью:
22
Кафедра математической статистики
23. Порядок выполнения теста Глейзера
Тест ГлейзераПорядок выполнения теста Глейзера
1)
по МНК оценивается линейная регрессия
2)
оценки
стандартных отклонений случайной
компоненты в каждом наблюдении вычисляются как:
3)
выбирается набор значений показателя степени ,
например, такой:
4)
для каждого строится по МНК регрессионная модель
вида:
;
23
Кафедра математической статистики
24. Порядок выполнения теста Глейзера (окончание)
Тест ГлейзераПорядок выполнения теста Глейзера
(окончание)
•5) с помощью t- статистики проверяется статистическая
значимость каждого коэффициента
;
6) если оценка
окажется статистически значима, то
имеет место гетероскедастичность.
Замечание. Если для нескольких значений параметра
получены статистически значимые оценки
, то следует
выбрать наилучшую из них (т. е. ту, для которой
t-статистика максимальна).
24
Кафедра математической статистики
25. Методы устранения гетероскедастичности.
ОМНКОсновной метод устранения
гетероскедастичности – обобщенный
метод наименьших квадратов (ОМНК).
Суть ОМНК – минимизация суммы
квадратов отклонений, в которой каждое
наблюдение присутствует с учетом его
“веса”.
Последствия ОМНК – получение
эффективных оценок для
коэффициентов регрессии.
25
Кафедра математической статистики
26. Применение ОМНК
ОМНКПрименение ОМНК
•Пусть в исходной модели:
имеет место гетероскедастичность, т. е.
Предположим, что дисперсия случайной компоненты в каждом
наблюдении известна.
Разделим каждое наблюдение на соответствующее ему значение
стандартного отклонения:
Положим
и
.
Тогда преобразованная модель примет вид:
26
Кафедра математической статистики
27. Применение ОМНК (продолжение)
ОМНКПрименение ОМНК (продолжение)
• Легко убедиться, что случайная компонента
• в полученной модели имеет нулевое математическое ожидание
и единичную дисперсию для всех наблюдений. Действительно,
и
• Следовательно, оценки коэффициентов регрессии можно найти
по обычному МНК, минимизируя следующую сумму квадратов
отклонений
27
Кафедра математической статистики
28. Применение ОМНК (окончание)
ОМНКПрименение ОМНК (окончание)
• Замечание. Основная трудность в применении обобщенного
(взвешенного) МНК состоит в том, что значения
, как
правило, неизвестны. На практике неизвестные значения либо
заменяют их оценками, либо подбирают некоторую величину,
пропорциональную в каждом наблюдении стандартному
отклонению
.
28
Кафедра математической статистики
29. Заключение
ВыводыПостроение любой эконометрической
модели должно включать проверку
выполнимости второго условия ГауссаМаркова.
Проверка осуществляется с помощью
статистических тестов.
При нарушении второго условия ГауссаМаркова следует предпринять шаги к
устранению гетероскедастичности.
Кафедра математической
статистики
29
30. Заключение
Выводы набудущее
Всякая наука только тогда достигает
своего совершенства , когда она
породнится с математикой.
И. Кант
Кафедра математической
статистики
30