Similar presentations:
Бинарные (фиктивные) переменные
1. БИНАРНЫЕ (ФИКТИВНЫЕ) ПЕРЕМЕННЫЕ
Оценить влияние качественных факторов в регрессионных моделях можно спомощью фиктивных (бинарных) переменных.
1. Модель с одним качественным фактором, принимающим два значения
Пример. Исследуется зависимость затрат на работу средней школы (ден.ед.)
от числа учащихся в ней и типа школы.
COST a1 N a2
Имеются данные по 74 средним школам (n=74)
2.
СтандарКоэффиц
тная
иенты
ошибка
Y-пересечение
N
tстатис
тика
PЗначение
23953,3
27167,96
0,881674
0,380887
339,0432
49,55144
6,842248
2,16E-09
COST 339 N 23953
Предельные затраты на 1 ученика 339 ден.ед.
Годовые постоянные затраты (администрация, обслуживание) 23953 ден.ед.
Cost
700000,0
600000,0
500000,0
400000,0
y = 339,04x + 23953
300000,0
200000,0
100000,0
0,0
0
200
400
600
800
N
1000
1200
1400
3.
1. Модель с одним качественным фактором, принимающим два значенияТеперь учтем тип школы.
1, åñëè i -ÿ ø êî ëà ï ðî ô åññèî í àëüí àÿ
Tipi
0, åñëè i-ÿ ø êî ëà î áû ÷í àÿ
COST a1 N a2Tip a3
a3 показывает постоянные затраты в обычной школе
a2 a3 показывает постоянные затраты в профессиональной школе
a2
показывает на сколько выше постоянные затраты в профессиональной школе по сравнению с обычной
H 0 : a2 0
Тип школы не влияет на постоянные издержки.
4.
2. Модель с одним качественным фактором, принимающим два значенияКоэффи
циенты
Стандар
тная
ошибка
tстатис
тика
PЗначени
е
Y-пересечение
-33612,6
23573,47
-1,42586
0,15829
N
331,4493
39,75844
8,336578
3,97E-12
Tip
133259,1
20827,59
6,398201
1,46E-08
COST 331N 133259Tip 33613
Предельные затраты на 1 ученика 331 ден.ед.
Постоянные издержки профессиональной школы превышают постоянные
издержки обычной школы на 133259 де.ед.
Годовые постоянные затраты профессиональной школы
составляют 133259-33613=99646 ден.ед.
Годовые постоянные затраты обычной школы составляют -33613 ден.ед.?
5.
2. Модель с одним качественным фактором, принимающим два значенияКоэффи
циенты
Стандар
тная
ошибка
tстатис
тика
PЗначени
е
Y-пересечение
-33612,6
23573,47
-1,42586
0,15829
N
331,4493
39,75844
8,336578
3,97E-12
Tip
133259,1
20827,59
6,398201
1,46E-08
COST 331N 133259Tip 33613
H 0 : a2 0
Тип школы не влияет на издержки.
6.
2. Модель с одним качественным фактором, принимающим два значенияScatterplot (schools 10v*75c)
Function = 331*x+99646
Function = 331*x-33613
7E5
проф. школы
6E5
COST 331N 133259 33613
5E5
обычные школы
cost
4E5
COST 331N 33613
3E5
2E5
1E5
0
-1E5
99
199
307
424
529
623
724
N
826
920
1017
1163
1267
7.
3. Модель с одним качественным фактором, принимающим несколько значений4 типа школы.
общеобразовательные
обычные
специализированные
профессиональные
технические
школы подготовки квалифицированных рабочих
1, åñëè i -ÿ ø êî ëà òåõí è÷åñêàÿ
TECH i
0, åñëè i-ÿ ø êî ëà í å òåõí è÷åñêàÿ
1, åñëè i-ÿ ø êî ëà ï î äãî òî âêè êâàë. ðàáî ÷èõ
WORKERi
0, åñëè i-ÿ ø êî ëà í å ø êî ëà ï î äãî òî âêè êâàë. ðàá.
1, åñëè i-ÿ ø êî ëà ñï åöèàëèçèðî âàí í àÿ
SPECi
0, åñëè i-ÿ ø êî ëà í å ñï åöèàëèçèðî âàí í àÿ.
8.
3. Модель с одним качественным фактором, принимающим несколько значенийTECH
WORKER
SPEC
техническая
1
0
0
школы подготовки
квалифицированных рабочих
0
1
0
специализированная
0
0
1
общеобразовательная
0
0
0
9.
3. Модель с одним качественным фактором, принимающим несколько значенийЗамечание: 4-ю бинарную переменную использовать нельзя.
Если
1, åñëè i-ÿ ø êî ëà î áù åî áðàçî âàòåëüí àÿ
ORDINARYi
0, åñëè i-ÿ ø êî ëà äðóãàÿ
то
WORKERi SPECi ORDINARYi TECH i 1
i
Регрессоры линейно зависимы, а в этом случае нельзя получить МНК оценки
10.
3. Модель с одним качественным фактором, принимающим несколько значенийCOST a1 N a2TECH a3WORKER a4 SPEC a5
a5 показывает постоянные затраты в общеобразовательной школе школе
a2 a5 показывает постоянные затраты в технической школе
a2
показывает на сколько выше постоянные затраты в технической школе
по сравнению с общеобразовательной
a3 a5
a3
показывает постоянные затраты в школе подготовки проф. рабочих
показывает на сколько выше постоянные затраты в школе подготовки
проф. Рабочих по сравнению с общеобразовательной
11.
3. Модель с одним качественным фактором, принимающим несколько значенийCOST a1 N a2TECH a3WORKER a4 SPEC a5
H 0 : a2 0
H 0 : a2 a4
постоянные затраты в технической школе не
отличаются от постоянных затрат в общеобразовательной
постоянные затраты в технической школе не
отличаются от постоянных затрат в специальной школе
H 0 : a2 a3 a4 0
Тип школы не влияет на постоянные затраты
12.
3. Модель с одним качественным фактором, принимающим несколько значенийКоэффициен
ты
Стандартна
я ошибка
tстатистика
Y-пересечение
-54893,1
26673,08
-2,058
0,04337
N
342,6335
40,2195
8,51909
2,25E-12
Tech
154110,9
26760,41
5,758915
2,15E-07
Worker
143362,4
27852,8
5,147144
2,38E-06
Spec
53228,64
31061,65
1,713645
0,091084
P-Значение
COST 343 N 154111 TECH 143362 WORKER 53229 SPEC 54893
Предельные затраты на 1 ученика 343 ден.ед.
Годовые постоянные затраты общеобразовательной школы составляют
-54893 ден.ед.?
Постоянные издержки технической школы превышают постоянные
издержки общеобразовательной школы на 154111 ден.ед.
Годовые постоянные затраты технической школы составляют
15411-54893=-39482 ден.ед.?
13.
3. Модель с одним качественным фактором, принимающим несколько значенийCOST 343 N 154111 TECH 143362 WORKER 53229 SPEC 54893
COST 343 N 54893
Функция издержек общеобразовательной школы
COST 343 N 154111 54893
COST 343 N 143362 54893
Функция издержек технической школы
Функция издержек школы подготовки проф.
рабочих
COST 343 N 53229 54893 Функция издержек специальной школы
14.
Function = 343*x-54893Function = 343*x+154111-54893
Function = 343*x+143362-54893
Function = 343*x+53229-54893
7E5
6E5
5E5
cost
4E5
3E5
2E5
1E5
0
-1E5
99
199
307
424
529
623
724
826
920
1017
1163
1267
N
общеобразовательные
специальные
Школы подготовки проф. рабочих
технические
15.
4. Модель с несколькими качественными факторамидля каждого фактора вводится своя группа фиктивных переменных
(число фиктивных переменных в группе равно числу уровней фактора минус один).
Пример. Исследуется зависимость затрат на работу средней школы (ден.ед.)
от числа учащихся в ней, типа школы и возможности проживания в школе.
1, åñëè i -ÿ ø êî ëà ï ðî ô åññèî í àëüí àÿ
Tipi
0, åñëè i-ÿ ø êî ëà î áû ÷í àÿ
1, åñëè i -ÿ ø êî ëà ÿâëÿåòñÿ èí òåðí àòî ì
INTERNATi
0, åñëè i -ÿ ø êî ëà í å ÿâëÿåòñÿ èí òåðí àòî ì
16.
4. Модель с несколькими качественными факторамиCOST a1 N a2Tip a3 INTERNAT a4
постоянные затраты в обычной школе, не являющейся
a4 показывает
интернатом
постоянные затраты в профессиональной школе,
a2 a4 показывает
не являющейся интернатом
a2
показывает на сколько выше постоянные затраты в профессиональной школе по сравнению с обычной
a3 a4
a3
показывает постоянные затраты в обычной школе-интернате
показывает на сколько выше постоянные затраты в школе-интернате
a2 a3 a4
показывает постоянные затраты в профессиональной школеинтернате
17.
4. Модель с несколькими качественными факторамиCOST a1 N a2Tip a3 INTERNAT a4
H 0 : a2 0
H 0 : a3 0
постоянные затраты одинаковы в обычной школе и профессиональной
постоянные затраты одинаковы в школе с проживанием и в
школе без проживания
18.
4. Модель с несколькими качественными факторамиКоэффици
енты
Y-пересечение
Стандарт
tная
статисти
ошибка
ка
PЗначение
-29045,3
23291,54
-1,24703
0,216543
321,833
39,40225
8,167884
8,96E-12
Tip
109564,6
24039,58
4,557674
2,14E-05
Internat
57909,01
30821,31
1,878863
0,064427
N
COST 322 N 109565 Tip 57909INTERNAT 29045
19.
4. Модель с несколькими качественными факторамиCOST 322 N 109565 Tip 57909INTERNET 29045
COST 322 N 29045
Функция издержек обычной школы без проживания
COST 322 N 109565 29045
COST 322 N 57909 29045
Функция издержек профессиональной
школы без проживания
Функция издержек обычной школыинтерната
COST 322 N 109565 57909 29045
Функция издержек профессиональной школы-интерната
20.
5. Фиктивные переменные для коэффициента наклонаПример Предположим, что от типа школы зависят не только постоянные издержки,
но и предельные
1, åñëè i -ÿ ø êî ëà ï ðî ô åññèî í àëüí àÿ
Tipi
0, åñëè i-ÿ ø êî ëà î áû ÷í àÿ
NTipi Ni Tipi
COST a1 N a2Tip a3 NTip a4
COST N a1 a3Tip a2Tip a4
21.
5. Фиктивные переменные для коэффициента наклонаCOST N a1 a3Tip a2Tip a4
Если школа обычная, то
COST a1 N a4
Если школа профессиональная, то
COST N a1 a3 a2Tip a4
a1 показывает предельные затраты в обычной школе
a1 a3 показывает предельные затраты в профессиональной школе
показывает на сколько выше предельные затраты в профессиональa3 ной школе по сравнению с обычной
H 0 : a3 0
Тип школы не влияет на предельные издержки.
22.
5. Фиктивные переменные для коэффициента наклонаКоэффиц
иенты
Стандар
тная
ошибка
tстатист
ика
PЗначение
Y-пересечение
51475,25
31314,84
1,643797
0,104703
N
152,2982
60,01932
2,537487
0,013395
Tip
-3501,18
41085,46
-0,08522
0,932332
Ntip
284,4786
75,63211
3,761347
0,000348
COST 152 N 3501Tip 284 NTip 51475
COST (152 284Tip) N 3501Tip 51475
Постоянные затраты для профессиональных школ ниже, чем для обычных!
Но этот коэффициент незначим. Следовательно, постоянные затраты не
зависят от типа школы.
23.
5. Фиктивные переменные для коэффициента наклонаКоэффици
енты
Стандарт
ная ошибка
tстатисти
ка
Y-пересечение
49441,31
20129,63
2,456146
0,016492
N
155,8469
42,91922
3,631169
0,000529
Ntip
278,7749
34,97094
7,971616
1,89E-11
P-Значение
COST 156N 279NTip 49441
COST (156 279Tip) N 49441
Предельные затраты для обычных школ 156 ден.ед.
Предельные затраты для профессиональных школ 156+279=435 ден.ед.
Постоянные затраты для всех школ 49441 ден.ед.
24.
5. Фиктивные переменные для коэффициента наклонаScatterplot (schools 10v*75c)
Function = 156*x+49441
Function = 435*x+49441
7E5
проф. школы
COST 156 N 49441
6E5
5E5
cost
4E5
3E5
обычные школы
2E5
COST 435 N 49441
1E5
0
99
199
307
424
529
623
724
N
826
920
1017
1163
1267
25.
6. Фиктивные переменные для учета фактора сезонностиПример yt – объем потребления некоторого продукта в месяц t.
потребление зависит от времени года
1, åñëè ì åñÿö t - çèì í èé;
z1t
0, åñëè ì åñÿö t - í å çèì í èé.
1, åñëè ì åñÿö t - âåñåí í èé;
z 2t
0, åñëè ì åñÿö t - í å âåñåí í èé.
1, åñëè ì åñÿö t - ëåòí èé;
z 3t
0, åñëè ì åñÿö t - í å ëåòí èé.
yt b1 z1t b2 z 2t b3 z 3t b4 t
26.
6. Фиктивные переменные для учета фактора сезонностиЗамечание: 4-я бинарная переменная не нужна. Если месяц t осенний, то
z1t 0, z 2t 0, z3t 0.
yt b1 z1t b2 z 2t b3 z 3t b4 t
b4 показывает среднемесячный объем потребления для осенних месяцев.
b1, b2, b3 показывают средние сезонные отклонения в объеме потребления
по отношению к осенним месяцам.
b1 b4
– средний объем потребления для зимних месяцев;
b2 b4
– средний объем потребления для весенних месяцев;
b3 b4
– средний объем потребления для летних месяцев.
27.
6. Фиктивные переменные для учета фактора сезонностиyt b1 z1t b2 z 2t b3 z 3t b4 t
H 0 : b1 0
H 0 : b1 b2
нет различия в объеме потребления в зимние и осенние
месяцы.
нет различия в объеме потребления в зимние и осенние
месяцы
H 0 : b1 b2 b3 0
потребление не зависит от сезона.
28.
6. Фиктивные переменные для учета фактора сезонностиИмеются помесячные данные о производстве электроэнергии (млрд.кВт/час)
Производство электроэнергии
100
95
90
85
Q
80
75
70
65
60
55
50
Jan-98
Jan-99
Jul-98
Jan-00
Jul-99
Jan-01
Jul-00
Jan-02
Jul-01
Jan-03
Jul-02
Jan-04
Jul-03
29.
6. Фиктивные переменные для учета фактора сезонностиQt 12,7 z1t 1,1z 2t 14,7 z3t 69,3 0,12t
30.
6. Фиктивные переменные для учета фактора сезонностиQt 12,7 z1t 1,1z 2t 14,7 z3t 69,3 0,12t
100
95
90
85
80
75
70
65
60
55
50
Jan-98
Jan-99
Jul-98
Jan-00
Jul-99
Jan-01
Jul-00
Jan-02
Jul-01
Jan-03
Jul-02
Jan-04
Jul-03
Q
predict