Similar presentations:
Множественная регрессия и корреляция. Лекция №3
1.
Лекция № 3множественная
регрессия и
корреляция.
2.
• Уравнение множественной регрессииy a b1 x1 b2 x2 ... b p x p
3.
Основнаярегрессии
цель
множественной
– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.
4.
например• Современная потребительская функция
чаще всего рассматривается как модель
вида
С f ( y , P, M , Z ) ,
• С – потребление;
• у – доход;
• P – цена,
• M – наличные деньги;
• Z – ликвидные активы;
5.
Построениеуравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.
6.
Условия включения факторов припостроении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.
7.
• 2. Факторы не должны бытьинтеркоррелированы.
8.
• Если между факторами существует высокаякорреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.
9.
• Пусть в уравненииy a b1 х1 b2 х 2
rx1x 2 0.
10.
Если же rx1x 2 1то b1 , b2 нельзя интерпретировать как
показатели раздельного влияния x1 и x 2
на у .
11.
Пример.• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб., x) и
производительности его труда (единиц в
час, z ):
y 22600 5 x 10 z
rxz = 0,95
12.
Отбор факторов при построениимножественной регрессии.
13.
• 2 этапа отбора факторов:– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1
14.
Пути преодоления сильноймежфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)
• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы
15.
• Предпочтение отдается не фактору,более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.
16.
• Пусть,например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:
17.
yx
z
v
y
x
0,8
1
0,7
0,8
1
0,6
0,5
0,2
z
v
1
1
18.
примерy
y
x
z
v
x
z
v
1
0,3
1
0,7
0,75
1
0,6
0,5
0,8
1
19.
• Для оценки мультиколлинеарностифакторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.
20.
• Если бы факторы не коррелировали междусобой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx1x1
Det R rx1x2
rx1x3
rx2 x1
rx 2 x 2
rx2 x3
rx3 x1
1 0 0
rx3 x2 0 1 0 1,
rx3 x3
0 0 1
21.
• Если же, наоборот, между факторамисуществует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен нулю:
1
Det R 1
1
1
1
1 0.
1
1
1
22.
• Таким образом,• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.
23.
• Через коэффициенты множественнойдетерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.
24.
• Сравнивая между собойкоэффициенты множественной
детерминации факторов
2
2
R x x , x ... x ; R x x x ... x ;
1 2 3
p
2 1 3
p
• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.
25.
• При дополнительном включении врегрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R
2
p 1
R
2
p
и
S
2
p 1
2
p
S .
26.
• Пусть для регрессии, включающих пятьфакторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,
вряд ли целесообразно дополнительно
включать в модель этот фактор.
27.
Оценка параметров уравнениямножественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения
28.
• В линейной множественной регрессииy x a b1 x1 b 2 x 2 ... b p x p
параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.
29.
• уравнение регрессии в стандартизованномвиде:
t y 1 t x1 2 t x2 b p t x p
30.
Где t y , yx , , t xпеременные
1
xi xi
t xi
,
xi
Свойства:
p
-стандартизованные
y y
ty
y
t y t xi 0,
t y t x 1;
i -стандартизованные коэффициенты
регрессии.
31.
• Стандартизованные коэффициенты регрессиипоказывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.
32.
• Стандартизованные коэффициенты регрессииi сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии
y
bi i
xi
33.
• Пример. Пусть функция издержекпроизводства y(тыс. руб.)
характеризуется уравнением вида
y 200 1,2 x1 1,1 x2
• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)
34.
• уравнение регрессии в стандартизованномвиде выглядит так
t y 0,5 t x1 0,8 t x 2 .
• Вывод:
35.
• Достоинство стандартизованныхкоэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением j