Similar presentations:
Эконометрика. Парная регрессия
1. Эконометрика
ХасановаСветлана Фанилевна
Лекция 1
LOGO
«Парная
регрессия»
www.themegallery.com
2. Парная линейная регрессия
Основная цель – построить уравнение(модель) вида:
Y = a + b*X
описывающее зависимость между
зависимой переменной (результатом - Y)
и независимой переменной (фактором –
X).
a и b – называются параметрами модели.
Примеры зависимостей:
•Выручки предприятия от расходов на рекламу;
•Цены на нефть от курса доллара,
•Количества баллов по эконометрике от
количества часов, потраченных на её изучение
и т.д.
3. Пример построения парной линейной регрессии
Изучается влияние объема ВВП на объем экспорта в стране.Для корреляционно-регрессионного анализа использована
выборка за 10 лет:
Построим график по следующему правилу:
По оси Y – зависимая переменная или изучаемая величина (экспорт)
По оси Х – независимая переменная или причинный фактор (ВВП)
Каждая точка графика соответствует
каждому году
4. График
Зависимость экспорта от объема ВВП400
Объем экспорта
350
300
250
200
150
100
50
0
900
1100
1300
Объем ВВП
1500
1700
5. График линейной зависимости
Зависимость экспорта от объема ВВПОбъем экспорта
400
Y = a + b*X
350
300
ei
250
ei
200
150
900
1100
1300
Объем ВВП
1500
2
2
е
(
y
y
)
i i предсказ min
1700
6. Формулы для нахождения параметров
При помощи метода наименьших квадратов (МНК) выведены формулыдля нахождения параметров уравнения (коэффициентов регрессии)
Экономический
смысл
Формула
b=
b
ух y x
x х
2
2
Показывает среднее
изменение результата
с изменением
фактора на одну
единицу
Значение y при x=0
a=
a y b x
7. Требование нормального распределения остатков
График плотности вероятности нормального распределения8. Требование нормального распределения остатков
Интегральная функция распределения нормальной СВ9. Коэффициент корреляции
Его значения находятся в границах: -1 ≤ r ≤1.b 0, то r 0, связь прямая;
b 0, то r 0, связь обратная .
Показывает:
yx y x
r
x y
1.
2.
Тесноту связи
Направление
связи
10. Шкала Чеддока для интерпретации коэффициента корреляции
0,9 – 0,999 Связь весьма высокая0,7 – 0,9 Связь высокая
0,5 – 0,7 Связь заметная
0,3 – 0,5 Связь умеренная
0,1 – 0,3 Связь слабая
0
│0,3│
│0,5│
│0,7│
│0,9│
│1│
11. Проверка качества подбора модели (вида уравнения)
ESSСумКО
объясненная
TSS
СумКО общая
y
y
2
ESS
RSS
2
R
1
TSS
TSS
yˆ
RSS
СумКО остаточная
y
2
y
ˆ
y
R r
2
2
2
0 R2 1
Коэффициент детерминации R2- характеризует
долю объясненной регрессией вариации y, в
общей вариации результативного признака
12. Характеристики модели
Число степеней свободы - это число независимо варьируемыхзначений признака.
Дисперсия на одну степень свободы - получается делением
каждой СКО на свое число степеней свободы
Dфакт.
yˆ x y 2
1
k
Общая
Остаточная
Факторная
y yˆ x 2
Dост.
n 2
n–k-1
Dобщ.
2
y
y
n 1
n-1
к – количество независимых переменных (для парной регрессии = 1)
13. Проверка статистической значимости модели
H 0 : Dфакт. Dост.Fнабл
Dфакт .
H1 : Dфакт. Dост.
Fраспобр(α;1;n-2)
Dост.
если:
Fнабл. Fтабл.
Модель
статистически не
значима
Fнабл. Fтабл.
Модель
статистически
значима
Если справедлива
Н0, то дисперсии
не отличаются
друг от друга. Для
Н0 необходимо
опровержение,
чтобы факторная
дисперсия
превышала
остаточную в
несколько раз.
14. Проверка статистической значимости параметров
Н0: b=0H1: b≠0
b
t набл
mb
tтабл
Стандартная
ошибка
параметра
=
СТЬЮДРАСПОБР(α;n-2)
если:
tнабл tтабл
Параметр
статистически
не значим
t набл t табл
Параметр
статистически
значим
mb
2
ˆ
y
y
x / n 2
2
x
x
2
mb
Dостат
2
x
x
15. Доверительный интервал для параметра
параметр b с надежностью α лежит винтервале:
b0 mb tтабл ( ; n 2) b b0 mb tтабл ( ; n 2)
значимость (α) = 1 – надежность(β)
Классические уровни α:
16. Анализ данных
Регрессионная статистикаМножественный R
0,719494
R-квадрат
0,517671
Нормированный Rквадрат
0,473823
Стандартная ошибка
53,13959
Наблюдения
Объясненная
доля
Вероятность,
с которой
модель не
значима
13
Дисперсионный анализ
df
Регрессия
Остаток
Итого
Y = -133,5 + 13,5*b
Y-пересечение
SS
1
11
12
33338,02
31061,98
64400
MS
33338,02
2823,816
F
11,80602
0,005564
Вероятность, с которой не значим параметр
Коэффициен Стандартна
ты
я ошибка t-статистика P-Значение
-133,542
Значимость
F
78,10357
-1,7098
0,115324
Нижние
95%
Верхние
95%
38,3631
-305,446
3
17. Парная нелинейная регрессия
Экспоненциальная функция:Зависимость экспорта от объема ВВП
Объем экспорта
Y
Экспоненциальная (Y)
Y a eb x
400
y = 80,116e0,0009x
R² = 0,9361
350
300
250
200
150
900
1100
1300
Объем ВВП
1500
1700
18. График нелинейной зависимости
Логарифмическая функцияЗависимость экспорта от объема ВВП
Y
Логарифмическая (Y)
Y a b ln( x)
Объем экспорта
400
350
300
y = 294,02ln(x) - 1844,1
R² = 0,8955
250
200
150
900
1100
1300
Объем ВВП
1500
1700
19. График нелинейной зависимости
Describe a Степеннаяvision of company
or strategic contents.
функция
Зависимость экспорта от объема ВВП
Y
Степенная (Y)
Объем экспорта
400
Y a x
b
y = 0,0752x1,1366
R² = 0,9271
350
300
250
200
150
900
1100
1300
Объем ВВП
1500
1700
20. Эластичность
Эластичность определяется поформуле:
х
Эb y '
y
Для парной регрессии:
Для степенной:
эb b
bx
эb
a b x
21. Уравнение множественной регрессии
Линейная модель:y a b1 x1 b2 x2 ... b p x p e
На любой экономический показатель чаще
всего оказывает влияние не один, а
несколько факторов.
Например, спрос на некоторое благо
определяется не только ценой данного
блага, но и ценами на замещающие и
дополняющие блага, доходом потребителей
и многими другими факторами.
22. Уравнение множественной регрессии в стандартизированном масштабе
Уравнение регрессии в стандартизованноммасштабе имеет вид:
t y 1t x1 2t x2 pt x p
стандартизированные параметры:
ty
y y
xj xj
; tx j
x j
y
Система уравнений:
1
r
1 x1 x 2
1rx1 x p
,
j 1, n
2 rx 2 x1
3rx3 x1
p rx p x1
ryx1
2 rx 2 x p
3rx3 x p
p
ryx p
2
3rx3 x 2
p rx p x 2
ryx2
23. Проверка качества уравнения множественной регрессии
Коэффициент детерминации:R2 1
ei2
2
y
y
i
Скорректированный к-т детерминации:
n 1
p
2
R 1 1 R
R
1 R2
n p 1
n p 1
2
2
24. Проверка статистической значимости модели
H 0 : R 0. ; H 1 : R 02
R2 n k 1
F
2
1 R
k
Fнабл. Fтабл.
Модель
статистически не
значима
2
Fраспобр(α;k;n-k-1)
если:
Fнабл. Fтабл.
Модель
статистически
значима
Если справедлива
Н0, то дисперсии
не отличаются
друг от друга. Для
Н0 необходимо
опровержение,
чтобы факторная
дисперсия
превышала
остаточную в
несколько раз.