Similar presentations:
Модели бинарного выбора
1. Модели бинарного выбора
Факультет менеджментаНаправление Управление проектами
Модели бинарного выбора
Выполнили:
Горшкова Виринея
Солодская Ольга
Пискунова Марина
Хайретдинов Эльдар
Группы: 626, 627
НИУ ВШЭ , Москва, 2013
www.hse.ru
2.
Моделибинарного выбора
Модели
бинарного
выбора
Модель зависимости бинарной переменной от совокупности факторов
Зависимая переменная принимает всего два значения — 0 и 1 (коды: 0 –нет; 1- да).
Метод оценивания: ММП (метод максимального правдоподобия)
photo
photo
Probit
используется
интегральная
функция стандартного
нормального
распределения
НИУ ВШЭ , Москва, 2013
Logit
используется CDF
логистического
распределения
Gambit
используется
распределение
экстремальных
значений - photo
распределение
Гомперца
2
3.
Алгоритмпостроения модели
Алгоритм
построения
модели
1. Определение зависимой переменной и факторов
photo
2. Построение переменной Z, как линейной комбинации
независимых переменных
3. Построение уравнения для искомой вероятности события
4. Проведение вычислений с помощью
5. метода максимального правдоподобия
photo
6. Интерпретация результатов и исследование качества
оценки
photo
НИУ ВШЭ , Москва, 2013
3
4.
Алгоритмпостроения модели
Сферы
применения
1. Медицина (определение вероятности успешного лечения и
т.п.)
photo
2. Социология
3. Маркетинговые исследования (предсказание склонности к
покупке)
4. Задачи классификации (скоринг в банках, маркетинг и пр.)
photo
Примеры:
• голосование;
• решение работать/не работать;
• решение покупать/не покупать товар длительного пользования (автомобиль, дом);
• форма собственности (государственная, смешанная, частная);
• выбор профессии (научный работник, преподаватель, консультант,
менеджер);
photo
• способ попадания из дома на работу (пешком, автобус, метро, метро и автобус,
автомобиль)
НИУ ВШЭ , Москва, 2013
4
5.
Показатели качества моделейПоказатели качества моделей
Псевдокоэффициент
детерминации
Информационные
критерии
Коэффициент
детерминации
МакФаддена
photo
Статистика
отношения
правдоподобия
photo
Доля правильных
прогнозов
photo
НИУ ВШЭ , Москва, 2013
5
6.
Показатели качествамоделей
Показатели
качества
моделей:
Информационные критерии
Акаике (AIC)
2 ln L 2k
AIC
n
n
Шварца (SC)
SC
2 ln L k ln( n)
n
n
Хэннана-Куинна (HQ)
HQ
2 ln L 2k ln ln( n)
n
n
photo
photo
photo
НИУ ВШЭ , Москва, 2013
6
7.
Преимуществаи недостатки
Преимущества и недостатки
моделей:
моделей
Преимущества
1. Исправление недостатка линейной модели,
в которой вероятность могла получаться
больше 1 (что логически неверно):
вероятность от 0 до 1
2. Легко интерпретируется (можем
идентифицировать увеличение/ снижения
вероятности наступления того или иного
события при процентом изменении
значения фактора – отношение шансов).
3. При решении задач классификации
объекты можно разделять на несколько
групп:
Например, в скоринге не только -(0 плохой, 1 - хороший), но и несколько
групп (1, 2, 3, 4 группы риска).
НИУ ВШЭ , Москва, 2013
Недостатки
1. Систематическое завышение
оценки коэффициентовphoto
регрессии
при размере выборки – менее 500
2. Проблемы мультиколлинеарности
3. Минимум 10 исходов на каждую
независимую переменную (к 1
недостатку)
photo
Например, интересующий
исход –
смерть пациента. Если 50
пациентов из 100 умирают –
максимальное число независимых
переменных в модели = 50/10=5
photo
7
8. Пример 1: соц. исследование
Исследование факторов, влияющих на вероятность окончания среднейшколы
Зависимая переменная: GRAD окончание средней школы
Индивид окончил школу «1», нет – «0».
Предикторы:
ASVABC - результат тестирования познавательных способностей
SM - число лет обучения матери респондента
SF - число лет обучения отца респондента
MALE - пол
•Nemes S, Jonasson JM, Genell A, Steineck G. 2009 Bias in odds ratios by logistic
regression modelling and sample size. BMC Medical Research Methodology
9.
Пример 1: верификация модели3)
(Подставляется полученное выражение для Z)
4)
Таблица оцененных коэффициентов. Далее для оценки кумулятивного и
предельного эффектов необходимо произвести дальнейшие расчеты,
подставив полученные коэффициенты в формулы.
10.
Пример 1: верификация моделиПример нахождения выражения
предельного эффекта для одной из
переменных
Столбец предельных эффектов
11.
Пример 1: отношение шансовИнтерпретация коэффициентов: отношения шансов
•Увеличение ASVABC на один балл увеличивает
вероятность успешного окончания школы на 0,4
процентных пункта.
•Аналогично, влияет принадлежность к мужскому
полу.
•Образование родителей влияет незначительно
•Кроме того, на 10% уровне значимости значим
только коэффициент при переменной ASVABC
12. Пример 2: финансовый менеджмент
Зависимая переменная: вероятность участия российских компаний вмежфирменных отношениях
Предикторы:
1. факторы окружающей среды
Уровень конкуренции в отрасли;
Принадлежность к отрасли;
Макро – показатели;
Уровень развития законодательства в отрасли;
Наличие поддержки со стороны предприятия.
2. характеристики компании
Срок присутствия на рынке
Количество собственников в совете директоров
Численность сотрудников
Наличие патентов