Similar presentations:
Бинарные (фиктивные) переменные
1. БИНАРНЫЕ (ФИКТИВНЫЕ) ПЕРЕМЕННЫЕ
Иногда в регрессионных моделях требуется учесть качественные факторы.Например, исследуется зависимость цены квартиры от ряда факторов.
На стоимость квартиры могут повлиять количественные факторы:
общая площадь, площадь кухни и т.д. и качественные факторы:
средний или крайний этаж, первичное или вторичное жилье, тип дома
(хрущевка, брежневка, улучшенной планировки) и т.д.
Оценить влияние качественных факторов в регрессионных моделях можно с
помощью фиктивных (бинарных) переменных.
2.
Пример: исследуется зависимость цены квартиры от ее площади и того,является ли этаж, на котором расположена квартира крайним или средним
Pr ice b1 S b2 Floor b3
Floor=0, если этаж крайний
Floor=1, если этаж средний
3.
5. Фиктивные переменные в нелинейных моделяхПример: исследуется зависимость цены квартиры от ее площади и того,
является ли этаж, на котором расположена квартира крайним или средним
Pr ice b1 S b2 Floor b3
Floor=0, если этаж крайний
b2
Floor=1, если этаж средний
показывает на сколько в среднем цена квартиры на средних этажах
выше цены квартиры на крайних этажах (при той же площади)
4.
Пример: исследуется зависимость цены квартиры от ее площади и того,является ли этаж, на котором расположена квартира крайним или средним
Pr ice b1 S b2 Floor b3
Floor=0, если этаж крайний
b2
Floor=1, если этаж средний
показывает на сколько в среднем цена квартиры на средних этажах
выше цены квартиры на крайних этажах (при той же площади)
Незначимость переменной b2 означает, что этаж не влияет на цену
5.
Фиктивные переменные в нелинейных моделяхПример: исследуется зависимость цены квартиры от ее площади и того,
является ли этаж, на котором расположена квартира крайним или средним
Pr ice S e
b1
Floor=1, если этаж крайний
b2 Floor
b3
Floor=0, если этаж средний
6.
Пример: исследуется зависимость цены квартиры от ее площади и того,является ли этаж, на котором расположена квартира крайним или средним
Pr ice S e
b1
Floor=1, если этаж крайний
b2 Floor
b3
Floor=0, если этаж средний
Для оценки модель логарифмируется
ln(Pr ice) b1 ln( S ) b2 Floor ln(b3 )
7.
Пример: исследуется зависимость цены квартиры от ее площади и того,является ли этаж, на котором расположена квартира крайним или средним
Pr ice S e
b1
Floor=1, если этаж крайний
eb2
b2 Floor
b3
Floor=0, если этаж средний
показывает во сколько раз в среднем цена квартиры на средних этажах
выше цены квартиры на крайних этажах (при той же площади)
8.
Пример: исследуется зависимость цены квартиры от ее площади и того,является ли этаж, на котором расположена квартира крайним или средним
Pr ice S
0.01
Floor=1, если этаж крайний
e
0.12 Floor
b3
Floor=0, если этаж средний
Квартиры на средних этажах в среднем в
e0.12 1.127
раз
дороже, чем квартиры на крайних этажах (при той же площади)
(иными словами, на 12,7%)
9.
Пример: исследуется зависимость цены квартиры от ее площади и того,является ли этаж, на котором расположена квартира крайним или средним
Pr ice S
0.01
Floor=1, если этаж крайний
e
0.12 Floor
b3
Floor=0, если этаж средний
Квартиры на средних этажах в среднем в
e0.12 1.127
раз
дороже, чем квартиры на крайних этажах (при той же площади)
(иными словами, на 12,7%)
10.
Имеются данные по однокомнатным квартирам, выставлявшимсяна продажу в Москве:
Region
район;
Distc
удаленность от центра, км.;
Distm
удаленность от метро, мин.;
Totsq
общий метраж, кв.м.;
Kitsq
площадь кухни, кв.м.;
Livsq
площадь комнаты, кв.м.;
Floor
этаж (0,1) 0 – первый или последний, 1 – средний;
Cat
категория дома (0,1), 1 – кирпичный, 0 – панельный;
Price
цена, тыс. USD.
11.
Линейная модель12.
Линейная модельPrice=-4.06-0.37distc-0.17distm+0.98totsq+1.21kitsq-0.07livsq+4.69floor+8.30cat
13.
Линейная модельPrice=-4.06-0.37distc-0.17distm+0.98totsq+1.21kitsq-0.07livsq+4.69floor+8.30cat
14.
Линейная модель после исключения незначимых факторовPrice=-10.11+0.94totsq+1.20kitsq+4.87floor+10.15cat
15.
Линейная модель после исключения незначимых факторовPrice=-10.11+0.94totsq+1.20kitsq+4.87floor+10.15cat
76% вариации цены квартир объясняется факторами, включенными в модель
Модель значима.
16.
Степенная модельPr ice a0 ( Distc) a1 ( Distm) a2 (Totsq ) a3 ( Kitsq ) a4 ( Livsq) a5 e a6 Floore a7 Cat
17.
Степенная модельPr ice a0 ( Distc) a1 ( Distm) a2 (Totsq ) a3 ( Kitsq ) a4 ( Livsq) a5 e a6 Floore a7 Cat
Логарифмируем
ln(Pr ice) ln(a0 ) a1 ln( Distc) a2 ln( Distm) a3 ln(Totsq)
a4 ln( Kitsq) a5 ln( Livsq) a6 Floor a7Cat
18.
Степенная модельln(Pr ice) ln(a0 ) a1 ln( Distc) a2 ln( Distm) a3 ln(Totsq)
a4 ln( Kitsq) a5 ln( Livsq) a6 Floor a7Cat
19.
Степенная модельln(Pr ice) ln(a0 ) a1 ln( Distc) a2 ln( Distm) a3 ln(Totsq)
a4 ln( Kitsq) a5 ln( Livsq) a6 Floor a7Cat
20.
Степенная модельln(Pr ice) ln(a0 ) a1 ln( Distc) a2 ln( Distm) a3 ln(Totsq)
a4 ln( Kitsq) a5 ln( Livsq) a6 Floor a7Cat
21.
Степенная модельln(Pr ice) ln(a0 ) a1 ln( Distc) a2 ln( Distm) a3 ln(Totsq)
a4 ln( Kitsq) a5 ln( Livsq) a6 Floor a7Cat
Ln(Price)=0.092+0.34ln(totsq)+0.11ln(kitsq)+0.053floor+0.1cat
22.
Степенная модельln(Pr ice) ln(a0 ) a1 ln( Distc) a2 ln( Distm) a3 ln(Totsq)
a4 ln( Kitsq) a5 ln( Livsq) a6 Floor a7Cat
Pr ice a0 ( Distc) ( Distm) (Totsq ) ( Kitsq ) ( Livsq) e
a1
a3
a2
a4
a5
a6 Floor a 7 Cat
e
Ln(Price)=0.092+0.34ln(totsq)+0.11ln(kitsq)+0.053floor+0.1cat
Ln(a0)=0.092,
a0=exp(0.092)=1.097
Pr ice 1.097(Totsq)
0.34
( Kitsq)
0.11 0.053 Floor 0.1Cat
e
e
23.
Степенная модельPr ice 1.097(Totsq)
0.34
( Kitsq)
Квартиры на средних этажах стоят в
e
0.053
0.11 0.053 Floor 0.1Cat
e
e
1.054
раз дороже, чем квартиры с теми же характеристиками на средних этажах
Иными словами, квартиры на средних этаж в среднем на 5.4% дороже, чем
квартиры на крайних этажах с теми же характеристиками
24.
Степенная модельPr ice 1.097(Totsq)
0.34
( Kitsq)
Квартиры в кирпичном доме стоят в
e
0.1
0.11 0.053 Floor 0.1Cat
e
e
1.11
раз дороже, чем квартиры с теми же характеристиками в панельных домах
Иными словами, квартиры в кирпичных домах в среднем на 11% дороже, чем
квартиры в панельных домах с теми же характеристиками
25.
Степенная модельPr ice 1.097(Totsq)
0.34
( Kitsq)
0.11 0.053 Floor 0.1Cat
e
e
74% вариации цены квартир объясняется факторами, включенными в модель
Модель значима.
26.
Выбор лучшей модели1) Коэффициент детерминации
2) Средняя ошибка аппроксимации
Pr ice 1.097(Totsq)
0.34
( Kitsq)
0.11 0.053 Floor 0.1Cat
e
e
27.
Выбор лучшей модели1) Коэффициент детерминации
2) Средняя ошибка аппроксимации
Pr ice 1.097(Totsq)
0.34
( Kitsq)
0.11 0.053 Floor 0.1Cat
e
e
28.
Выбор лучшей модели1) Коэффициент детерминации
2) Средняя ошибка аппроксимации
Pr ice 1.097(Totsq)
0.34
( Kitsq)
0.11 0.053 Floor 0.1Cat
e
e
29.
Выбор лучшей модели1) Коэффициент детерминации
2) Средняя ошибка аппроксимации
Pr ice 1.097(Totsq)
0.34
( Kitsq)
0.11 0.053 Floor 0.1Cat
e
e
Используя выбранную модель, осуществите прогноз цены
однокомнатной квартиры, находящейся на расстоянии 10 км от
центра, 5 мин. ходьбы до метро, общей площадью 35 кв.м,
площадью кухни 8 кв.м, жилой площадью 33 кв.м, расположенной на
1-м этаже кирпичного дома.