МОДЕЛЬ МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ
Пример: Множественная регрессия
МОДЕЛЬ МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ
ИНТЕРПРЕТАЦИЯ ПАРАМЕТРОВ ЛИНЕЙНОЙ МНОЖЕСТВЕННОЙ РЕГРЕССИИ
Как оценить качество построенной модели?
Как оценить качество построенной модели?
Как оценить качество построенной модели?
Как оценить качество построенной модели?
Как оценить качество построенной модели?
Проверка значимости коэффициентов модели регрессии
Проверка значимости коэффициентов модели регрессии
Проверка значимости коэффициентов модели регрессии
Проверка значимости коэффициентов модели регрессии
Проверка значимости уравнения регрессии в целом
Проверка значимости уравнения регрессии в целом
Проверка значимости уравнения регрессии в целом
315.50K
Category: economicseconomics

Модель множественной линейной регрессии

1. МОДЕЛЬ МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ

В модели множественной регрессии переменная y зависит от нескольких
переменных х.

2. Пример: Множественная регрессия

Мы хотим определить связь между потреблением, доходом
семьи, финансовыми активами семьи и размером семьи.
• y – потребительские расходы.
• x1 – доход семьи
• x2 – финансовые активы семьи
• x3 – размер семьи
y a1 x1 a2 x2 a3 x3 a4

3. МОДЕЛЬ МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ

y a1 x1 a2 x2 a3 x3 a4
Для оценки необходима выборка (большое количество семей)

семьи
y
x1
потребительские
расходы
доход
семьи
x2
x3
финансовые
активы семьи
размер
семьи
1
100
20
300
2
2
120
30
50
3
3
230
100
400
4
4
150
80
200
1
5
340
170
140
3

4.

n – объем выборки
yi
xi1
xi 2
доходы i-й семьи
xi 3
размер i-й семьи
потребительские расходы i-й семьи
доход i-й семьи
i 1 n
4

5.

Уравнение для i-й семьи
yi a1 xi1 a2 xi 2 a3 xi 3 a4 i
Чтобы подобрать наилучшие a , a , a , a
1
2
3
4
n
S (a1 , a2 , a3 , a4 ) yi a1 xi1 a2 xi 2 a3 xi 3 a4
2
i 1
min S (a1 , a2
a1 , a2
ar
ar )
5

6.

Модель строим с помощью Сервис – Анализ данных - регрессия
Пример: Имеются данные о потреблении мяса в США B в 1980 – 2007 годах
(фунты на душу населения), и его зависимости от цены P (центы за фунт) и
личного располагаемого дохода YD (тысячи долларов в расчете на душу
населения).
Построим модель зависимости потребления мяса от цены и дохода
6

7.

Модель строим с помощью Сервис – Анализ данных - регрессия
Пример: Имеются данные о потреблении мяса в США B в 1980 – 2007 годах
(фунты на душу населения), и его зависимости от цены P (центы за фунт) и
личного располагаемого дохода YD (тысячи долларов в расчете на душу
населения).
Построим модель зависимости потребления мяса от цены и дохода
B=57.34-0.938P+9.892YD
7

8. ИНТЕРПРЕТАЦИЯ ПАРАМЕТРОВ ЛИНЕЙНОЙ МНОЖЕСТВЕННОЙ РЕГРЕССИИ

Интерпретация: коэффициент регрессии при переменной xi
показывает на сколько единиц изменится переменная y при
изменении переменной xi на 1 единицу, при условии
постоянства других переменных:

9.

Модель строим с помощью Сервис – Анализ данных - регрессия
Пример: Имеются данные о потреблении мяса в США B в 1980 – 2007 годах
(фунты на душу населения), и его зависимости от цены P (центы за фунт) и
личного располагаемого дохода YD (тысячи долларов в расчете на душу
населения).
Построим модель зависимости потребления мяса от цены и дохода
B=57.34-0.938P+9.892YD
При увеличении цены на мясо на 1 цент за фунт потребление сократится на
0,938 фунтов на душу населения
9

10.

Модель строим с помощью Сервис – Анализ данных - регрессия
Пример: Имеются данные о потреблении мяса в США B в 1980 – 2007 годах
(фунты на душу населения), и его зависимости от цены P (центы за фунт) и
личного располагаемого дохода YD (тысячи долларов в расчете на душу
населения).
Построим модель зависимости потребления мяса от цены и дохода
B=57.34-0.938P+9.892YD
Какой фактор цена или доход влияет сильнее на потребление мяса?
10

11.

Сравнение влияния на зависимую переменную
различных объясняющих переменных
Расчет средних эластичностей
P
EP aP
B
Средняя эластичность по цене. Показывает на сколько % изменится
потребление мяса, если цена увеличится на 1% процент.
xj

12.

Сравнение влияния на зависимую переменную
различных объясняющих переменных
Расчет средних эластичностей
EYD aYD
YD
B
Средняя эластичность по доходу. Показывает на сколько %
изменится потребление мяса, если доход увеличится на 1%
процент.
Чем больше эластичность по абсолютной величине, тем сильнее влияние

13. Как оценить качество построенной модели?

Вычисляем прогноз по модели
B=57.34-0.938P+9.892YD

14. Как оценить качество построенной модели?

Вычисляем остатки
e y y

15. Как оценить качество построенной модели?

Находим относительную ошибку аппроксимации
A
y y
y
Процентный формат

16. Как оценить качество построенной модели?

Находим среднюю относительную ошибку аппроксимации
среднее по столбцу
В среднем прогноз отличается от наблюдаемого значения на 2,91%

17. Как оценить качество построенной модели?

Еще один показатель качества – коэффициент детерминации
Для его вычисления вычисляем сумму квадратов остатков ESS
(Error Sum of Squares). Его можно вычислить также как для линейной модели
или просто посмотреть в таблице вывода результатов

18. Проверка значимости коэффициентов модели регрессии

Построено уравнение
B aYD bP c
Необходимо проверить значимость коэффициентов а и b
Если коэффициент a незначим, то потребление мяса не зависит
от цены. Если коэффициент b незначим, то потребление мяса не зависит от
дохода

19. Проверка значимости коэффициентов модели регрессии

Построено уравнение
B aYD bP c
Необходимо проверить значимость коэффициентов а и b
Если коэффициент a незначим, то потребление мяса не зависит
от цены. Если коэффициент b незначим, то потребление мяса не зависит от
дохода
Для проверки значимости коэффициентов рассчитываются величины T
a
b
Ta , Tb
sa
sb

20. Проверка значимости коэффициентов модели регрессии

21. Проверка значимости коэффициентов модели регрессии

На основе t-статистик рассчитывают Р-значения
Р-значение - это вероятность того, что переменная не значима. При Рзначении меньще 0,05 обычно считают, что соответствующая переменная
значима, т.е. y зависит от этой х
В этом примере обе переменные P и YD значимы, т.е. и цена, и доход влияют
на потребление мяса

22. Проверка значимости уравнения регрессии в целом

Уравнение регрессии считается незначимым, если ни одна из переменных,
включенных в уравнение не влияет на переменную y
Для проверки значимости уравнения регрессии в целом, рассчитывается
F-статистика

23. Проверка значимости уравнения регрессии в целом

Уравнение регрессии считается незначимым, если ни одна из переменных,
включенных в уравнение не влияет на переменную y
Для проверки значимости уравнения регрессии в целом, рассчитывается
F-статистика
Значимость F показывает вероятность того, что уравнение незначимо, т.е
y не зависит от включенных в уравнение переменных х. Обычно считают,
что если Значимость F<0.05, то уравнение регрессии значимо, т.е. хотя бы
одна из включенных в уравнение переменных влияет на y.

24. Проверка значимости уравнения регрессии в целом

Уравнение регрессии считается незначимым, если ни одна из переменных,
включенных в уравнение не влияет на переменную y
Для проверки значимости уравнения регрессии в целом, рассчитывается
F-статистика
В нашем случае уравнение регрессии значимо.
English     Русский Rules