1.06M
Category: programmingprogramming

Изменения в единицах измерения

1.

ИЗМЕНЕНИЯ В ЕДИНИЦАХ ИЗМЕРЕНИЯ
Yi 1 2 X i ui
Yˆi b1 b2 X i
b2
X X Y Y
X X
i
i
2
i
Предположим, что единицы измерения Y или X изменены. Как это повлияет на
результаты регрессии? Интуитивно мы ожидаем, что ничего существенного не
произойдет. Так оно и есть.
1

2.

ИЗМЕНЕНИЯ В ЕДИНИЦАХ ИЗМЕРЕНИЯ
Yi 1 2 X i ui
Yˆi b1 b2 X i
b2
X X Y Y
X X
i
i
2
i
Мы продемонстрируем это для оценок коэффициентов регрессии. Начнем с
предположения, что истинная и расчетная модели приведены выше.
2

3.

ИЗМЕНЕНИЯ В ЕДИНИЦАХ ИЗМЕРЕНИЯ
Yi 1 2 X i ui
Yˆi b1 b2 X i
b2
X X Y Y
X X
i
i
2
i
Yi* 1 2Yi
Yˆi* b1* b2* X i
Предположим теперь, что единицы измерения Y изменяются, причем новая мераY*,
является линейной функцией старой.
3

4.

ИЗМЕНЕНИЯ В ЕДИНИЦАХ ИЗМЕРЕНИЯ
Yi 1 2 X i ui
Yˆi b1 b2 X i
b2
X X Y Y
X X
i
i
2
i
Yi* 1 2Yi
Yˆi* b1* b2* X i
Как правило, изменение единицы измерения включает в себя простое
мультипликативное масштабирование, например, когда мы конвертируем фунты в
граммы.
4

5.

ИЗМЕНЕНИЯ В ЕДИНИЦАХ ИЗМЕРЕНИЯ
Yi 1 2 X i ui
Yˆi b1 b2 X i
b2
X X Y Y
X X
i
i
2
i
Yi* 1 2Yi
Yˆi* b1* b2* X i
Иногда происходит линейное преобразование. Примером может служить конверсия
температур от градусов Цельсия до градусов Фаренгейта.
5

6.

ИЗМЕНЕНИЯ В ЕДИНИЦАХ ИЗМЕРЕНИЯ
Yi 1 2 X i ui
b2
Yˆi b1 b2 X i
X X Y Y
X X
i
i
2
i
Yi* 1 2Yi
Yˆi* b1* b2* X i
*
*
X i X 1 2Yi 1 2Y
X
X
Y
Y
i
i
*
b2
2
2
X
X
X
X
i
i
X X Y Y X X Y Y
b
X X
X X
i
2 i
2
2
i
i
2
2
i
2 2
i
Показан новый коэффициент наклона b2*.
6

7.

ИЗМЕНЕНИЯ В ЕДИНИЦАХ ИЗМЕРЕНИЯ
Yi 1 2 X i ui
b2
Yˆi b1 b2 X i
X X Y Y
X X
i
i
2
i
Yi* 1 2Yi
Yˆi* b1* b2* X i
*
*
X i X 1 2Yi 1 2Y
X
X
Y
Y
i
i
*
b2
2
2
X
X
X
X
i
i
X X Y Y X X Y Y
b
X X
X X
i
2 i
2
2
i
i
2
2
i
2 2
i
Подставим Y*.
7

8.

ИЗМЕНЕНИЯ В ЕДИНИЦАХ ИЗМЕРЕНИЯ
Yi 1 2 X i ui
b2
Yˆi b1 b2 X i
X X Y Y
X X
i
i
2
i
Yi* 1 2Yi
Yˆi* b1* b2* X i
*
*
X i X 1 2Yi 1 2Y
X
X
Y
Y
i
i
*
b2
2
2
X
X
X
X
i
i
X X Y Y X X Y Y
b
X X
X X
i
2 i
2
2
i
i
2
2
i
2 2
i
Остается только 2.
8

9.

ИЗМЕНЕНИЯ В ЕДИНИЦАХ ИЗМЕРЕНИЯ
Yi 1 2 X i ui
b2
Yˆi b1 b2 X i
X X Y Y
X X
i
i
2
i
Yi* 1 2Yi
Yˆi* b1* b2* X i
*
*
X i X 1 2Yi 1 2Y
X
X
Y
Y
i
i
*
b2
2
2
X
X
X
X
i
i
X X Y Y X X Y Y
b
X X
X X
i
2 i
2
2
i
i
2
2
i
2 2
i
Мы находим, что новый коэффициент наклона равен исходному, умноженному на 2.
9

10.

ИЗМЕНЕНИЯ В ЕДИНИЦАХ ИЗМЕРЕНИЯ
Yi 1 2 X i ui
b2
Yˆi b1 b2 X i
X X Y Y
X X
i
i
2
i
Yi* 1 2Yi
Yˆi* b1* b2* X i
*
*
X i X 1 2Yi 1 2Y
X
X
Y
Y
i
i
*
b2
2
2
X
X
X
X
i
i
X X Y Y X X Y Y
b
X X
X X
i
2 i
2
2
i
i
2
2
i
2 2
i
Это логично. Единичное изменение в Y такое же, как изменение 2 единиц в Y*.
Согласно уравнению регрессии, единичное изменение X приводит к изменению b2
единиц вY, поэтому это должно привести к изменению 2b2 единиц вY*.
10

11.

ИЗМЕНЕНИЯ В ЕДИНИЦАХ ИЗМЕРЕНИЯ
Yi 1 2 X i ui
b2
Yˆi b1 b2 X i
X X Y Y
X X
i
i
2
i
Yi* 1 2Yi
Yˆi* b1* b2* X i
*
*
X i X 1 2Yi 1 2Y
X
X
Y
Y
i
i
*
b2
2
2
X
X
X
X
i
i
X X Y Y X X Y Y
b
X X
X X
i
2 i
2
2
i
i
2
2
i
2 2
i
Эффект изменения единиц измерения X оставлен в качестве упражнения.
11

12.

ИЗМЕНЕНИЯ В ЕДИНИЦАХ ИЗМЕРЕНИЯ
Yi 1 2 X i ui
Yˆi b1 b2 X i
b2
X X Y Y
X X
i
i
2
i
Мы рассмотрим частный случай изменения единиц измерения X. Часто свободный
член в уравнении регрессии не имеет разумной интерпретации, потому что X = 0
расположен далеко от диапазона данных.
12

13.

ИЗМЕНЕНИЯ В ЕДИНИЦАХ ИЗМЕРЕНИЯ
^
EARNINGS
= –13.93 + 2.46 S
120
Hourly earnings ($)
100
80
60
40
20
0
0
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16 17 18 19 20
-20
Years of schooling (highest grade completed)
Предыдущая презентация является примером, поскольку свободный член является
отрицательным.
13

14.

ИЗМЕНЕНИЯ В ЕДИНИЦАХ ИЗМЕРЕНИЯ
. reg EARNINGS S
Source |
SS
df
MS
-------------+-----------------------------Model | 19321.5589
1 19321.5589
Residual | 92688.6722
538 172.283777
-------------+-----------------------------Total | 112010.231
539 207.811189
Number of obs
F( 1,
538)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
540
112.15
0.0000
0.1725
0.1710
13.126
-----------------------------------------------------------------------------EARNINGS |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------S |
2.455321
.2318512
10.59
0.000
1.999876
2.910765
_cons | -13.93347
3.219851
-4.33
0.000
-20.25849
-7.608444
------------------------------------------------------------------------------
Вот результат построения регрессии.
14

15.

ИЗМЕНЕНИЯ В ЕДИНИЦАХ ИЗМЕРЕНИЯ
. reg EARNINGS S
Source |
SS
df
MS
-------------+-----------------------------Model | 19321.5589
1 19321.5589
Residual | 92688.6722
538 172.283777
-------------+-----------------------------Total | 112010.231
539 207.811189
Number of obs
F( 1,
538)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
540
112.15
0.0000
0.1725
0.1710
13.126
-----------------------------------------------------------------------------EARNINGS |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------S |
2.455321
.2318512
10.59
0.000
1.999876
2.910765
_cons | -13.93347
3.219851
-4.33
0.000
-20.25849
-7.608444
------------------------------------------------------------------------------
Предыдущая презентация.
15

16.

ИЗМЕНЕНИЯ В ЕДИНИЦАХ ИЗМЕРЕНИЯ
Yi 1 2 X i ui
Yˆi b1 b2 X i
b2
X X Y Y
X X
i
i
2
i
X i* X i X
Yˆi b1* b2* X i*
Можно справиться с этой проблемой, определив X* как отклонение X от его среднего
значения.
16

17.

ИЗМЕНЕНИЯ В ЕДИНИЦАХ ИЗМЕРЕНИЯ
Yi 1 2 X i ui
Yˆi b1 b2 X i
b2
X X Y Y
X X
i
i
2
i
X i* X i X
Yˆi b1* b2* X i*
*
X
i Xi X
X i nX
nX nX 0
X*
1
*
X
i 0
n
Заметим, что по определению сумма Xi* равна 0, и, следовательно, среднее значение
X* равно 0.
17

18.

ИЗМЕНЕНИЯ В ЕДИНИЦАХ ИЗМЕРЕНИЯ
Yi 1 2 X i ui
Yˆi b1 b2 X i
b2
X X Y Y
X X
i
i
2
i
X i* X i X
Yˆi b1* b2* X i*
*
2
b
X X Y Y X Y
X X
X
X X Y Y
b
X X
*
i
*
*
i
i
* 2
*
i
i
i
2
i
Y
*2
i
X* 0
2
i
Если мы ищем уравнение регрессии Y от X* место X, то коэффициент наклона не
изменяется.
18

19.

ИЗМЕНЕНИЯ В ЕДИНИЦАХ ИЗМЕРЕНИЯ
Yi 1 2 X i ui
Yˆi b1 b2 X i
b2
X X Y Y
X X
i
i
2
i
X i* X i X
Yˆi b1* b2* X i*
*
2
b
X X Y Y X Y
X X
X
X X Y Y
b
X X
*
i
*
*
i
i
* 2
*
i
i
i
2
i
Y
*2
i
X* 0
2
i
b1* Y b2* X * Y
Теперь свободный член представляет собой среднее значение Y при среднем
значении X.
19

20.

ИЗМЕНЕНИЯ В ЕДИНИЦАХ ИЗМЕРЕНИЯ
-----------------------------------------------------------------------------. sum S
Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+-------------------------------------------------------S |
540
13.67222
2.438476
7
20
. gen SDEV = S - 13.67
Мы находим среднее значение выборки (в Stata мы используем команду «sum»). Мы
находим, что среднее составляет 13.67 лет, и мы определяем новую переменную SDEV
путем вычитания 13.67 из S.
20

21.

ИЗМЕНЕНИЯ В ЕДИНИЦАХ ИЗМЕРЕНИЯ
. reg EARNINGS SDEV
Source |
SS
df
MS
-------------+-----------------------------Model | 19321.5587
1 19321.5587
Residual | 92688.6723
538 172.283778
-------------+-----------------------------Total | 112010.231
539 207.811189
Number of obs
F( 1,
538)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
540
112.15
0.0000
0.1725
0.1710
13.126
-----------------------------------------------------------------------------EARNINGS |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------SDEV |
2.455321
.2318512
10.59
0.000
1.999876
2.910765
_cons |
19.63077
.5648401
34.75
0.000
18.5212
20.74033
------------------------------------------------------------------------------
Вот результат с использованием SDEV вместо S. Свободный член = 19.63, теперь дает
прогнозируемый доход тех, кто имеет среднее образование.
21

22.

ИЗМЕНЕНИЯ В ЕДИНИЦАХ ИЗМЕРЕНИЯ
. reg EARNINGS SDEV
Source |
SS
df
MS
Number of obs =
540
-------------+-----------------------------F( 1,
538) = 112.15
Model | 19321.5587
1 19321.5587
Prob > F
= 0.0000
Residual | 92688.6723
538 172.283778
R-squared
= 0.1725
-------------+-----------------------------Adj R-squared = 0.1710
Total | 112010.231
539 207.811189
Root MSE
= 13.126
-----------------------------------------------------------------------------EARNINGS |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
SDEV |
2.455321
.2318512
10.59
0.000
1.999876
2.910765
_cons |
19.63077
.5648401
34.75
0.000
18.5212
20.74033
-----------------------------------------------------------------------------. reg EARNINGS S
Source |
SS
df
MS
Number of obs =
540
-------------+-----------------------------F( 1,
538) = 112.15
Model | 19321.5589
1 19321.5589
Prob > F
= 0.0000
Residual | 92688.6722
538 172.283777
R-squared
= 0.1725
-------------+-----------------------------Adj R-squared = 0.1710
Total | 112010.231
539 207.811189
Root MSE
= 13.126
-----------------------------------------------------------------------------EARNINGS |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
S |
2.455321
.2318512
10.59
0.000
1.999876
2.910765
_cons | -13.93347
3.219851
-4.33
0.000
-20.25849
-7.608444
------------------------------------------------------------------------------
Сравнивая новый результат с оригиналом, мы видим, что помимо стандартной
ошибки и t статистики свободного члена ничего больше не изменилось.
22

23.

ИЗМЕНЕНИЯ В ЕДИНИЦАХ ИЗМЕРЕНИЯ
^
EARNINGS
= 19.63 + 2.46 S
120
Hourly earnings ($)
100
80
60
40
20
0
-14 -13 -12 -11 -10 -9
-8
-7
-6
-5
-4
-3
-2
-1
0
1
2
3
4
5
6
7
-20
Years of schooling (deviation from mean)
Единственным эффектом изменения S является перемещение вертикальной оси до
точки, которая раньше была 13.67. Как следствие, свободный член становится 19.63. В
остальном линия регрессии не изменяется
23
English     Русский Rules