829.89K
Category: mathematicsmathematics

Категориальные зависимые переменные (модели дискретного выбора)

1.

ТЕМА 3. КАТЕГОРИАЛЬНЫЕ
ЗАВИСИМЫЕ ПЕРЕМЕННЫЕ
(МОДЕЛИ ДИСКРЕТНОГО
ВЫБОРА)
К.Э.Н., ДОЦЕНТ
СИНЯВСКАЯ ТАТЬЯНА ГЕННАДЬЕВНА

2.

• ЧАСТО ВОЗНИКАЕТ НЕОБХОДИМОСТЬ МОДЕЛИРОВАТЬ
ЗАВИСИМОСТЬ ОТ НАБОРА ФАКТОРОВ ПЕРЕМЕННОЙ, НЕ
ЯВЛЯЮЩЕЙСЯ НЕПРЕРЫВНОЙ (КОЛИЧЕСТВЕННО ИЗМЕРЕННОЙ).
• ДЛЯ МОДЕЛИРОВАНИЯ ЗАВИСИМОСТИ ОТ НЕКОТОРЫХ
ФАКТОРОВ ПЕРЕМЕННОЙ, ПРИНИМАЮЩЕЙ ОГРАНИЧЕННОЕ
КОЛИЧЕСТВО ДИСКРЕТНЫХ ЗНАЧЕНИЙ (КАТЕГОРИАЛЬНОЙ)
ИСПОЛЬЗУЮТСЯ МОДЕЛИ ДИСКРЕТНОГО ВЫБОРА.

3.

ТИПЫ РЕГРЕССИИ ПРИ КАТЕГОРИАЛЬНОЙ
ЗАВИСИМОЙ ПЕРЕМЕННОЙ
Количество категорий
зависимой переменной
Две
Модель логистической
регрессии (логитмодель)
Три и более
Тип зависимой
переменной
Пробит-модель
Порядковая
Номинальная
Модель порядковой
регрессии
Модель мультиноминальной
(полиноминальной) регрессии

4.

МОДЕЛИ БИНАРНОГО ОТКЛИКА

5.

• КЛАССИЧЕСКАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ НЕ НАЛАГАЕТ ОГРАНИЧЕНИЙ НА
ВИД ЗАВИСИМОЙ ПЕРЕМЕННОЙ. В ТО ЖЕ ВРЕМЯ СУЩЕСТВУЕТ БОЛЬШОЙ
КЛАСС ЗАДАЧ, В КОТОРЫХ НАМ НЕОБХОДИМО НАЛОЖИТЬ ОПРЕДЕЛЕННЫЕ
ОГРАНИЧЕНИЯ НА МОДЕЛИРУЕМУЮ ПЕРЕМЕННУЮ. НАИБОЛЕЕ ЧАСТО РЕЧЬ
ИДЕТ О ТОМ, ЧТО МОДЕЛИРУЕМАЯ ПЕРЕМЕННАЯ ИМЕЕТ НЕ
НЕПРЕРЫВНУЮ, А ДИСКРЕТНУЮ ПРИРОДУ. НАПРИМЕР, ЭКОНОМИЧЕСКИ
АКТИВНЫЙ ИНДИВИД МОЖЕТ НАХОДИТЬСЯ В ОДНОМ ИЗ ДВУХ
СОСТОЯНИЙ: ЗАНЯТ ЭКОНОМИЧЕСКОЙ ДЕЯТЕЛЬНОСТЬЮ ИЛИ НЕТ
(БЕЗРАБОТНЫЙ). ТАКАЯ МОДЕЛЬ, КОГДА ЗАВИСИМАЯ ПЕРЕМЕННАЯ МОЖЕТ
ПРИНИМАТЬ ДВА ЗНАЧЕНИЯ (0 ИЛИ 1), НАЗЫВАЕТСЯ МОДЕЛЬЮ
БИНАРНОГО ОТКЛИКА И ОТНОСИТСЯ К КЛАССУ МОДЕЛЕЙ
КАЧЕСТВЕННОГО (ДИСКРЕТНОГО) ВЫБОРА.

6.

ЛИНЕЙНАЯ ВЕРОЯТНОСТНАЯ МОДЕЛЬ
• МОДЕЛЬ ВИДА
НЕ ПРИМЕНИМА К
ДИСКРЕТНЫМ ЗАВИСИМЫМ ПЕРЕМЕННЫМ, ТАК КАК:
• ОШИБКА БУДЕТ ПРИНИМАТЬ ТОЛЬКО 2 ЗНАЧЕНИЯ И ПОДЧИНЯЕТСЯ
ДИСКРЕТНОМУ РАСПРЕДЕЛЕНИЮ, ЧТО ПРИВЕДЕТ К
ГЕТЕРОСКЕДАСТИЧНОСТИ В МОДЕЛИ;
• ОЦЕНКИ МНК БУДУТ СМЕЩЕННЫМИ И НЕЭФФЕКТИВНЫМИ,
ПРОЦЕДУРЫ ПРОВЕРКИ ЗНАЧИМОСТИ КОЭФФИЦИЕНТОВ НЕ БУДУТ
РАБОТАТЬ;
• МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ ЗАВИСИМОЙ ПЕРЕМЕННОЙ
ИНТЕРПРЕТИРУЕТСЯ, КАК ВЕРОЯТНОСТЬ, ТОГДА КАК ПРОГНОЗ ПО
ЛИНЕЙНОЙ МОДЕЛИ БУДЕТ ПРИНИМАТЬ ЛЮБЫЕ ЗНАЧЕНИЯ ОТ –
ДО + .

7.

ПОНЯТИЕ ЛОГИТ- И ПРОБИТ-МОДЕЛИ

8.

• ПУСТЬ ИМЕЮТСЯ ДАННЫЕ НАБЛЮДЕНИЙ ДВОИЧНОЙ ПЕРЕМЕННОЙ Y.
ПРЕДПОЛОЖИМ, ЧТО СУЩЕСТВУЕТ НЕКАЯ НЕНАБЛЮДАЕМАЯ ИЛИ ЛАТЕНТНАЯ
ПЕРЕМЕННАЯ У*, ИЗМЕНЯЮЩАЯСЯ ОТ - ДО + , КОТОРАЯ ПОРОЖДАЕТ
НАБЛЮДАЕМУЮ ЗАВИСИМУЮ ПЕРЕМЕННУЮ У. ТАКИМ ОБРАЗОМ, У* ИМЕЕТ
БОЛЬШИЕ ЗНАЧЕНИЯ ПРИ У=1 И, СООТВЕТСТВЕННО, МЕНЬШИЕ ПРИ У=0.
ПОНЯТИЕ ЛАТЕНТНОЙ (СКРЫТОЙ) ПЕРЕМЕННОЙ – ОСНОВНОЕ В ДАННОМ
ПОДХОДЕ ОПРЕДЕЛЕНИЯ МОДЕЛИ БИНАРНОГО ОТКЛИКА (ЛОГИТ И ПРОБИТ
МОДЕЛИ).

9.

• КАК УЖЕ ОТМЕЧАЛОСЬ ВЫШЕ, РАССМАТРИВАЕТСЯ ИНДИВИД,
ОТНОСЯЩИЙСЯ К ЭКОНОМИЧЕСКИ АКТИВНОМУ НАСЕЛЕНИЮ,
КОТОРЫЙ МОЖЕТ НАХОДИТЬСЯ В ОДНОМ ИЗ ДВУХ СОСТОЯНИЙ:
ЗАНЯТОГО ЭКОНОМИЧЕСКОЙ ДЕЯТЕЛЬНОСТЬЮ ИЛИ НЕТ
(БЕЗРАБОТНОГО).
• ДОБАВИМ, ЧТО ПРИ ЭТОМ ОДИН ИНДИВИД МОЖЕТ БЫТЬ БЛИЗОК К
РЕШЕНИЮ ОСТАВИТЬ РАБОТУ И ЗАНЯТЬСЯ ПОИСКОМ НОВОЙ, БОЛЕЕ
ПОДХОДЯЩЕЙ; ДРУГОЙ МОЖЕТ БЫТЬ ПОЛНОСТЬЮ УДОВЛЕТВОРЕН
СВОИМ МЕСТОМ РАБОТЫ. В ОБОИХ СЛУЧАЯХ МЫ НАБЛЮДАЕМ У=1.
ИДЕЯ ЛАТЕНТНОЙ ПЕРЕМЕННОЙ СОСТОИТ В ТОМ, ЧТО СУЩЕСТВУЕТ
РЯД ФАКТОРОВ, ПОРОЖДАЮЩИХ НАБЛЮДАЕМОЕ СОСТОЯНИЕ. МЫ НЕ
МОЖЕМ НЕПОСРЕДСТВЕННО НАБЛЮДАТЬ У*, НО ИЗМЕНЕНИЕ ЭТОЙ
ПЕРЕМЕННОЙ – ЭТО РЕЗУЛЬТАТ ТАКИХ ИЗМЕНЕНИЙ, КОТОРЫЕ МЫ
МОЖЕМ НАБЛЮДАТЬ.

10.

ГРАФИЧЕСКАЯ ИЛЛЮСТРАЦИЯ

11.

• ПРЕДПОЛОЖИМ, ЧТО ЛАТЕНТНАЯ ПЕРЕМЕННАЯ У*
ЛИНЕЙНО ЗАВИСИТ ОТ ВЕКТОРА НАБЛЮДАЕМЫХ
ПЕРЕМЕННЫХ Х:
y xi i
*
i

12.

• ЛАТЕНТНАЯ ПЕРЕМЕННАЯ У* СВЯЗАНА С
НАБЛЮДАЕМОЙ БИНАРНОЙ ПЕРЕМЕННОЙ
У СЛЕДУЮЩЕЙ СИСТЕМОЙ:
1 если у i *
уi
0 если y i *
• ГДЕ – ЭТО НЕКОТОРОЕ ПОРОГОВОЕ
ЗНАЧЕНИЕ.

13.

• ТАКИМ ОБРАЗОМ, У=0, ЕСЛИ У* МЕНЬШЕ
ИЛИ РАВНО НЕКОТОРОМУ ПОРОГОВОМУ
ЗНАЧЕНИЮ , ЕСЛИ ЖЕ У* ПРЕВЫШАЕТ ЭТО
ЗНАЧЕНИЕ, ТО У=1. НЕ НАРУШАЯ
ОБЩНОСТИ, МОЖНО СЧИТАТЬ, ЧТО =0. В
ДАЛЬНЕЙШЕМ МЫ БУДЕМ ИСХОДИТЬ
ИМЕННО ИЗ ЭТОГО.

14.

• ОДНАКО, ТАК КАК ЗАВИСИМАЯ ПЕРЕМЕННАЯ НЕ НАБЛЮДАЕТСЯ,
МОДЕЛЬ НЕ МОЖЕТ БЫТЬ ОЦЕНЕНА МЕТОДОМ НАИМЕНЬШИХ
КВАДРАТОВ. В ЭТОМ СЛУЧАЕ ВМЕСТО МНК ИСПОЛЬЗУЮТ МЕТОД
МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ, КОТОРЫЙ ТРЕБУЕТ
ПРЕДПОЛОЖЕНИЯ О РАСПРЕДЕЛЕНИИ ОШИБОК. НАИБОЛЕЕ
ЧАСТО ВЫБИРАЮТ МЕЖДУ НОРМАЛЬНЫМ И ЛОГИСТИЧЕСКИМ
РАСПРЕДЕЛЕНИЯМИ. ЕСЛИ ВЫБИРАЕТСЯ НОРМАЛЬНОЕ
РАСПРЕДЕЛЕНИЕ, ТО МОДЕЛЬ НАЗЫВАЕТСЯ ПРОБИТ МОДЕЛЬЮ,
ЕСЛИ ЛОГИСТИЧЕСКОЕ, ТО ЛОГИТ МОДЕЛЬЮ. КАК И В
ЛИНЕЙНОЙ РЕГРЕССИОННОЙ МОДЕЛИ, МЫ ПРЕДПОЛАГАЕМ, ЧТО
E( |X)=0.

15.

• ТАК КАК У* НЕ НАБЛЮДАЕМА, ТО, СЛЕДОВАТЕЛЬНО, МЫ
НЕ МОЖЕМ ОЦЕНИТЬ ДИСПЕРСИЮ ОШИБОК, ПОЭТОМУ
ДЛЯ ПРОБИТ МОДЕЛИ ПРЕДПОЛОЖИМ, ЧТО VAR( |X)=1, А
ДЛЯ ЛОГИТ МОДЕЛИ – ЧТО VAR( |X)= 2/3 3,29.
ВЫБРАННОЕ КОНКРЕТНОЕ ЗНАЧЕНИЕ ПРОИЗВОЛЬНО В
ТОМ СМЫСЛЕ, ЧТО ОНО НЕ ОПРЕДЕЛЯЕТСЯ ПО
ИМЕЮЩИМСЯ ДАННЫМ: ОНО ВЫБРАНО ТАКИМ
ОБРАЗОМ, ЧТОБЫ ПОЛУЧИТЬ ПРОСТЕЙШЕЕ ВЫРАЖЕНИЕ
ДЛЯ ФУНКЦИИ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ
ВЕЛИЧИНЫ .

16.

• В РЕЗУЛЬТАТЕ ЭТИХ ПРЕДПОЛОЖЕНИЙ МЫ ПОЛУЧИМ
ФУНКЦИЮ ПЛОТНОСТИ ВЕРОЯТНОСТИ СЛЕДУЮЩЕГО
ВИДА:
( )
1
2
exp(
2
2
exp( )
( )
[1 exp( )] 2
)
• - ДЛЯ НОРМАЛЬНОГО ЗАКОНА;
• - ДЛЯ ЛОГИСТИЧЕСКОГО ЗАКОНА.

17.

• И ФУНКЦИИ РАСПРЕДЕЛЕНИЯ:
( )
t2
exp( )dt • - ДЛЯ НОРМАЛЬНОГО ЗАКОНА;
2
2
1
exp( )
( )
• - ДЛЯ ЛОГИСТИЧЕСКОГО
1 exp( )
ЗАКОНА.
• ТАКИЕ РАСПРЕДЕЛЕНИЯ НАЗЫВАЮТСЯ
СТАНДАРТНЫМ НОРМАЛЬНЫМ И СТАНДАРТНЫМ
ЛОГИСТИЧЕСКИМ РАСПРЕДЕЛЕНИЯМИ.

18.

• ПРИ ИСПОЛЬЗОВАНИИ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ –
ПОЛУЧАЕМ ПРОБИТ-МОДЕЛЬ (PROBIT).
• ПРИ ИСПОЛЬЗОВАНИИ ЛОГИСТИЧЕСКОГО РАСПРЕДЕЛЕНИЯ
– ЛОГИТ-МОДЕЛЬ (LOGIT).
• ХОТЯ МОДЕЛИ ПО СВОЕЙ СУТИ ПРАКТИЧЕСКИ
ТОЖДЕСТВЕННЫ, ЛОГИТ-МОДЕЛЬ ИСПОЛЬЗУЕТСЯ ЧАЩЕ.
ЕЩЕ ЕЕ НАЗЫВАЮТ МОДЕЛЬЮ ЛОГИСТИЧЕСКОЙ РЕГРЕССИИ.

19.

• МЕЖДУ ЛОГИТ И ПРОБИТ МОДЕЛЯМИ СУЩЕСТВУЕТ СВЯЗЬ:
ОШИБКИ
НЕ
ИДЕНТИЧНЫ,
ТАК
КАК
ЛОГИСТИЧЕСКОЕ
И
НОРМАЛЬНОЕ
РАСПРЕДЕЛЕНИЯ С ЕДИНИЧНОЙ ДИСПЕРСИЕЙ РАВНЫ ТОЛЬКО ПРИМЕРНО. ТАКИМ
ОБРАЗОМ,
ОСНОВЫВАЯСЬ
НА
ЭТОМ
СООТНОШЕНИИ,
МОЖНО
УСТАНОВИТЬ
СЛЕДУЮЩУЮ СВЯЗЬ МЕЖДУ КОЭФФИЦИЕНТАМИ ПРОБИТ И ЛОГИТ МОДЕЛЕЙ:
• ОДНАКО ЭМЕМИЯ (1981) ПРЕДЛОЖИЛ ДЛЯ СРАВНЕНИЯ КОЭФФИЦИЕНТОВ ПРОБИТ И
ЛОГИТ МОДЕЛИ ИСПОЛЬЗОВАТЬ ВЗВЕШИВАНИЕ НЕ НА 1,81, А НА 1,6. ВЗВЕШИВАНИЕ НА
1,6 ДАЕТ, ПО ЕГО МНЕНИЮ, БОЛЕЕ ЛУЧШИЕ РЕЗУЛЬТАТЫ. ОДНАКО LONG (1997) ИСХОДЯ
ИЗ СВОЕЙ ПРАКТИКИ СЧИТАЕТ, ЧТО БОЛЕЕ ПОДХОДИТ ВЗВЕШИВАНИЕ НА 1,7.

20.

• РАССМОТРИМ ЛОГИТ МОДЕЛЬ ДЛЯ СЛУЧАЯ ОДНОЙ НЕЗАВИСИМОЙ ПЕРЕМЕННОЙ:
Pr( y 1 | x ) ( x )
• ПРИ УВЕЛИЧЕНИИ ЗНАЧЕНИЯ Х НА ЕДИНИЦУ АРГУМЕНТ ФУНКЦИИ РАСТЕТ НА
ЕДИНИЦ.
НЕЛЬЗЯ ИНТЕРПРЕТИРОВАТЬ ТАК ЖЕ, КАК В ЛИНЕЙНОЙ РЕГРЕССИИ, ТАК КАК ОНО
ЗАВИСИТ ОТ:
1) СВЯЗИ МЕЖДУ Х И У*;
2) ПРЕДПОЛОЖЕНИЙ, СДЕЛАННЫХ ДЛЯ ОПРЕДЕЛЕНИЯ МОДЕЛИ.
• НЕСМОТРЯ НА ТО, ЧТО ЭТИ ПРЕДПОЛОЖЕНИЯ ВЛИЯЮТ НА ЗНАЧЕНИЕ , ОНИ НЕ
ВЛИЯЮТ НА ВЕРОЯТНОСТЬ PR(Y=1|X).

21.

• ДЛЯ ОЦЕНИВАНИЯ МОДЕЛЕЙ БИНАРНОГО ОТКЛИКА МЕТОД
НАИМЕНЬШИХ КВАДРАТОВ НЕПРИМЕНИМ.
• ДЛЯ ЭТОГО ИСПОЛЬЗУЕТСЯ МЕТОД МАКСИМАЛЬНОГО
ПРАВДОПОДОБИЯ.
• ДЛЯ КАЖДОЙ МОДЕЛИ ВЫПОЛНЯЕТСЯ ПРОВЕРКА
ЗНАЧИМОСТИ УРАВНЕНИЯ В ЦЕЛОМ (С ИСПОЛЬЗОВАНИЕМ
СТАТИСТИКИ ХИ-КВАДРАТ) И КАЖДОГО ПАРАМЕТРА ПО
ОТДЕЛЬНОСТИ (С ПОМОЩЬЮ Z-КРИТЕРИЯ).

22.

МЕТОД МАКСИМАЛЬНОГО
ПРАВДОПОДОБИЯ В МОДЕЛЯХ
ЛОГИСТИЧЕСКОЙ РЕГРЕССИИ

23.

• ПУСТЬ (X1,…,XN) – НЕЗАВИСИМАЯ ВЫБОРКА, СООТВЕТСТВУЮЩАЯ
НЕКОТОРОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЕ, КОТОРАЯ ИМЕЕТ ПЛОТНОСТЬ
РАСПРЕДЕЛЕНИЯ F ( XI ; 1,..., K). ФУНКЦИЕЙ ПРАВДОПОДОБИЯ
НАЗЫВАЕТСЯ ФУНКЦИЯ
• ОЦЕНКАМИ МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ ПАРАМЕТРОВ 1, 2,...,
К НАЗЫВАЕТСЯ НАБОР 1* = 1* (X1,X2,...,XN),..., K* = K*(X1,X2,...,XN),
МАКСИМИЗИРУЮЩИЙ ЗНАЧЕНИЕ L(X1,...,XN; 1,..., K ) ПРИ ДАННЫХ X1,
X2,..., XN. ЕСЛИ ПЛОТНОСТЬ L( X; 1,..., K ) ДИФФЕРЕНЦИРУЕМА, ТО
1*,..., K* –РЕШЕНИЕ СИСТЕМЫ УРАВНЕНИЙ

24.

25.


ДЛЯ ОПРЕДЕЛЕНИЯ УРАВНЕНИЯ ПРАВДОПОДОБИЯ ВВЕДЕМ P
КАК ВЕРОЯТНОСТЬ НАБЛЮДАТЬ КАКОЕ-ЛИБО ЗНАЧЕНИЕ У:
PR(YI=1|XI) ОПРЕДЕЛЯЕТСЯ УРАВНЕНИЕМ:
ГДЕ F ДЛЯ ЛОГИТ МОДЕЛИ – ЭТО ЛОГИСТИЧЕСКАЯ ФУНКЦИЯ
РАСПРЕДЕЛЕНИЯ , А ДЛЯ ПРОБИТ МОДЕЛИ – ЭТО ФУНКЦИЯ
РАСПРЕДЕЛЕНИЯ НОРМАЛЬНОГО ЗАКОНА .

26.

• ЕСЛИ НАБЛЮДЕНИЯ НЕЗАВИСИМЫ, УРАВНЕНИЕ ПРАВДОПОДОБИЯ БУДЕТ:
• КОМБИНИРУЯ УРАВНЕНИЯ, ПОЛУЧАЕМ:
• ГДЕ ИНДЕКС ПОКАЗЫВАЕТ, КАКОЙ РЕЗУЛЬТАТ БРАТЬ ДЛЯ УМНОЖЕНИЯ: ТОТ, ГДЕ У=1,
ИЛИ У=0, СООТВЕТСТВЕННО.

27.

• ДОБАВИМ В УРАВНЕНИЕ ПРАВДОПОДОБИЯ ПРАВУЮ ЧАСТЬ УРАВНЕНИЯ
• ПОЛУЧИМ:
• ЛОГАРИФМИРУЯ, МЫ ПОЛУЧАЕМ ЛОГАРИФМИЧЕСКОЕ УРАВНЕНИЕ ПРАВДОПОДОБИЯ:
• AMEMIYA (1985) ДОКАЗАЛ, ЧТО ПРИ ВЫПОЛНЕНИИ УСЛОВИЙ, КОТОРЫЕ РАЗУМНЫ ДЛЯ
ПРИМЕНЕНИЯ НА ПРАКТИКЕ, ФУНКЦИЯ ПРАВДОПОДОБИЯ ГЛОБАЛЬНО ВОГНУТА, ЧТО
ОБЕСПЕЧИВАЕТ ЕДИНСТВЕННОСТЬ ОЦЕНОК МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ.

28.

ОЦЕНКА КАЧЕСТВА МОДЕЛИ
ДЛЯ ОЦЕНКИ КАЧЕСТВА МОДЕЛИ ИСПОЛЬЗУЮТСЯ ДВА АНАЛОГА R2 ДЛЯ ЛИНЕЙНОЙ
РЕГРЕССИИ: PSEUDO R2 И MCFADDENR2.
ПУСТЬ LNL1 РАВЕН МАКСИМУМУ ЛОГАРИФМИЧЕСКОЙ ФУНКЦИИ ПРАВДОПОДОБИЯ
ДЛЯ НАШЕЙ МОДЕЛИ, А LNL0 РАВЕН МАКСИМУМУ ЛОГАРИФМИЧЕСКОЙ ФУНКЦИИ
ПРАВДОПОДОБИЯ ДЛЯ МОДЕЛИ, В КОТОРОЙ ВСЕ ПАРАМЕТРЫ, ЗА ИСКЛЮЧЕНИЕМ
СВОБОДНОГО ЧЛЕНА, РАВНЫ НУЛЮ. ОЧЕВИДНО, ЧТО LNL1 LNL0. ЧЕМ БОЛЬШЕ
РАЗЛИЧАЮТСЯ ИХ ЗНАЧЕНИЯ, ТЕМ ЛУЧШЕ НАША МОДЕЛЬ. ИМЕННО НА ЭТОМ ФАКТЕ
СТРОЯТСЯ ОБА ПОКАЗАТЕЛЯ.

29.

• PSEUDO R2
• ГДЕ N – ЭТО ОБЪЁМ ВЫБОРКИ.
• MCFADDEN R2
• МЕРУ, ПРЕДЛОЖЕННУЮ МАКФАДДЕНОМ, ТАКЖЕ ЧАСТО НАЗЫВАЮТ ИНДЕКСОМ
ОТНОШЕНИЯ ПРАВДОПОДОБИЯ (LIKELIHOOD RATIO INDEX).

30.

ПРОВЕРКА ГИПОТЕЗ

31.

• ОЦЕНКИ, ПОЛУЧЕННЫЕ МЕТОДОМ МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ, КАК УЖЕ
ОТМЕЧАЛОСЬ ВЫШЕ, АСИМПТОТИЧЕСКИ НОРМАЛЬНЫ. ТО ЕСТЬ ПРИ УВЕЛИЧЕНИИ
РАЗМЕРА ВЫБОРКИ ВЫБОРОЧНОЕ РАСПРЕДЕЛЕНИЕ МП-ОЦЕНОК АППРОКСИМИРУЕТСЯ
РАСПРЕДЕЛЕНИЕМ ПО НОРМАЛЬНОМУ ЗАКОНУ. ТОГДА ЗАКОН РАСПРЕДЕЛЕНИЯ ДЛЯ
ОТДЕЛЬНОГО ПАРАМЕТРА БУДЕТ ВЫГЛЯДЕТЬ СЛЕДУЮЩИМ ОБРАЗОМ:

32.

• РАССМОТРИМ НАИБОЛЕЕ ПРОСТОЙ ТЕСТ:
• В СООТВЕТСТВИИ С ПРЕДПОЛОЖЕНИЯМИ ДЛЯ ОЦЕНИВАНИЯ С ПОМОЩЬЮ МЕТОДА
МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ ЭТА Z-СТАТИСТИКА РАСПРЕДЕЛЕНА ПО
НОРМАЛЬНОМУ ЗАКОНУ С НУЛЕВЫМ СРЕДНИМ И ЕДИНИЧНОЙ ДИСПЕРСИЕЙ. ЧАСТО
ДЛЯ ЭТОЙ СТАТИСТИКИ ИСПОЛЬЗУЮТ T-РАСПРЕДЕЛЕНИЕ (РАСПРЕДЕЛЕНИЕ
СТЬЮДЕНТА) И, СООТВЕТСТВЕННО, НАЗЫВАЮТ T-СТАТИСТИКОЙ. ОДНАКО КОГДА
ЧИСЛО НАБЛЮДЕНИЙ ВЕЛИКО (НАПРИМЕР, БОЛЕЕ 100), ТО УВЕЛИЧИВАЕТСЯ И ЧИСЛО
СТЕПЕНЕЙ СВОБОДЫ ДЛЯ T-РАСПРЕДЕЛЕНИЯ (КОЛИЧЕСТВО НАБЛЮДЕНИЙ МИНУС
ЧИСЛО ПАРАМЕТРОВ), ТОГДА ЭТО РАСПРЕДЕЛЕНИЕ ПРИБЛИЖАЕТСЯ К НОРМАЛЬНОМУ,
А ПРИ ЧИСЛЕ СТЕПЕНЕЙ СВОБОДЫ БОЛЕЕ 120 СОВПАДАЕТ С НИМ.

33.

• КРОМЕ ТРАДИЦИОННОГО ДЛЯ ЛИНЕЙНОЙ РЕГРЕССИИ Z-ТЕСТА, В
МОДЕЛЯХ БИНАРНОГО ОТКЛИКА ИСПОЛЬЗУЮТ ТРИАДУ ТЕСТОВ,
ОСНОВЫВАЮЩИХСЯ НА МП-ОЦЕНКАХ. ЭТО ТЕСТ ВАЛЬДА (W,
WALD TEST), ТЕСТ ОТНОШЕНИЯ ПРАВДОПОДОБИЯ (LR ИЛИ G2,
LIKELIHOOD RATIO TEST) И ТЕСТ МНОЖИТЕЛЯ ЛАГРАНЖА (LM,
LAGRANGE MULTIPLIER TEST).
• ЭТИ ТЕСТЫ ПОЗВОЛЯЮТ НАМ ПРОВЕРЯТЬ СЛОЖНЫЕ ГИПОТЕЗЫ,
НАПРИМЕР, О ТОМ, ЧТО НЕСКОЛЬКО КОЭФФИЦИЕНТОВ РАВНЫ
МЕЖДУ СОБОЙ ИЛИ ЧТО СУММА КОЭФФИЦИЕНТОВ РАВНА
КАКОМУ-ТО ЧИСЛУ.

34.

ИНТЕРПРЕТАЦИЯ КОЭФФИЦИЕНТОВ МОДЕЛИ
• ИНТЕРПРЕТАЦИЯ КОЭФФИЦИЕНТОВ МОДЕЛИ БИНАРНОГО ОТКЛИКА
АНАЛОГИЧНО ЛИНЕЙНОЙ МОДЕЛИ РЕГРЕССИИ НЕВОЗМОЖНА.
ДЛЯ ЛОГИСТИЧЕСКОЙ РЕГРЕССИИ НАИБОЛЕЕ УДОБНЫМ СПОСОБОМ
ИНТЕРПРЕТАЦИИ
ЯВЛЯЕТСЯ
ИСПОЛЬЗОВАНИЕ
ОТНОШЕНИЯ
ШАНСОВ
(ODDS RATIO), КОТОРЫЙ ПОКАЗЫВАЕТ НАСКОЛЬКО БОЛЬШЕ ИЛИ МЕНЬШЕ
ЧАСТОТА СЛУЧАЕВ ВЫПЛАЧИВАТЬ ИПОТЕКУ В КАЖДОЙ КАТЕГОРИИ
СОЦИАЛЬНО-ЭКОНОМИЧЕСКОЙ
ПЕРЕМЕННОЙ
КОНТРОЛЬНОЙ КАТЕГОРИИ (СВОБОДНОМУ ЧЛЕНУ).
ПО
ОТНОШЕНИЮ
К

35.

• ОПРЕДЕЛИМ ОТНОШЕНИЕ ВЕРОЯТНОСТЕЙ ДВУХ СОБЫТИЙ,
КОТОРОЕ НАЗЫВАЕТСЯ ШАНСОМ (ODDS):
• ИЗ ПОЛУЧЕННОЙ ФОРМУЛЫ ВИДНО, ЧТО ЛОГАРИФМ КОЭФФИЦИЕНТА ОТНОШЕНИЯ
ВЕРОЯТНОСТЕЙ ПРЕДСТАВЛЯЕТ СОБОЙ ЛИНЕЙНУЮ ФУНКЦИЮ ПЕРЕМЕННОЙ X.

36.

• ЕСЛИ Х ДИСКРЕТНА, ТО:
• ОТНОШЕНИЕ ШАНСОВ, РАВНОЕ ЕДИНИЦЕ, УКАЗЫВАЕТ НА ОТСУТСТВИЕ РАЗЛИЧИЙ
МЕЖДУ СРАВНИВАЕМЫМИ ГРУППАМИ (ГРУППОЙ, ВЫРАЖЕННОЙ ПЕРЕМЕННОЙ Х И
ЭТАЛОНОМ).
• ЕСЛИ ЭТА ВЕЛИЧИНА БОЛЬШЕ ЕДИНИЦЫ, ТО ШАНСЫ ДЛЯ ГРУППЫ, ВЫРАЖЕННОЙ
ПЕРЕМЕННОЙ Х, ИМЕТЬ ЗНАЧЕНИЕ ЗАВИСИМОЙ ПЕРЕМЕННОЙ, РАВНОЕ 1, ВЫШЕ, ЧЕМ
ДЛЯ ЭТАЛОНА, В СООТВЕТСТВУЮЩЕЕ ЧИСЛО РАЗ.
• ЕСЛИ OR < 1, ТО ШАНСЫ ТО ШАНСЫ ДЛЯ ГРУППЫ, ВЫРАЖЕННОЙ ПЕРЕМЕННОЙ Х,
ИМЕТЬ ЗНАЧЕНИЕ ЗАВИСИМОЙ ПЕРЕМЕННОЙ, РАВНОЕ 1, НИЖЕ, ЧЕМ ДЛЯ ЭТАЛОНА, В
СООТВЕТСТВУЮЩЕЕ ЧИСЛО РАЗ.
• В СЛУЧАЕ, ЕСЛИ ПЕРЕМЕННАЯ X ИМЕЕТ НЕПРЕРЫВНЫЙ ХАРАКТЕР, ТО
ЭКСПОНЕНТА КОЭФФИЦИЕНТА ПОКАЗЫВАЕТ НАСКОЛЬКО УВЕЛИЧАТСЯ ИЛИ
УМЕНЬШАТСЯ ШАНСЫ ИМЕТЬ ЗНАЧЕНИЕ ЗАВИСИМОЙ ПЕРЕМЕННОЙ, РАВНОЕ 1, ПРИ
УВЕЛИЧЕНИИ НА ЕДИНИЦУ ВЕЛИЧИНЫ ФАКТОРА X.

37.

• АНАЛОГИЧНО ИНТЕРПРЕТИРУЮТСЯ
КОЭФФИЦИЕНТЫ МОДЕЛИ С ЛЮБЫМ ЧИСЛОМ
ФАКТОРОВ (ДИСКРЕТНЫХ И НЕПРЕРЫВНЫХ)

38.

ПРИМЕР МОДЕЛИ ЛОГИСТИЧЕСКОЙ РЕГРЕССИИ

39.

ЗАДАЧА ОЦЕНКИ СКЛОННОСТИ ИНДИВИДА К
ЭКОНОМИЧЕСКОМУ РИСКУ
• ПОЛУЧЕНЫ ДАННЫЕ ПОСРЕДСТВОМ ОПРОСА 515 РАБОТНИКОВ
• ОПРОС ПРОВЕДЕН В РОСТОВСКОЙ ОБЛАСТИ.
• НАЛИЧИЕ ИЛИ ОТСУТСТВИЕ СКЛОННОСТИ К ЭКОНОМИЧЕСКОМУ РИСКУ ОПРЕДЕЛЯЛОСЬ ПО
АВТОРСКОЙ ШКАЛЕ, ВКЛЮЧАЮЩЕЙ СПЕЦИАЛЬНО РАЗРАБОТАННЫЕ ВОПРОСЫ. АНКЕТА,
НАПРАВЛЕННАЯ НА ВЫЯВЛЕНИЕ, ЯВЛЯЕТСЯ ЛИ ИНДИВИД СКЛОННЫМ К ПОВЫШЕННОМУ РИСКУ,
ВКЛЮЧАЕТ ДВА БЛОКА ПО 14 ВОПРОСОВ В КАЖДОМ. ПЕРВЫЙ ОСНОВАН НА ЧАСТИ ПЯТИФАКТОРНОГО
ОПРОСНИКА АЙЗЕНКА, И ЧАСТИ ВОПРОСОВ ОПРОСНИКА ФЕРНАМА. ВТОРОЙ БЛОК РАЗРАБОТАН
АВТОРАМИ СПЕЦИАЛЬНО ДЛЯ РЕШЕНИЯ ИССЛЕДОВАТЕЛЬСКОЙ ЗАДАЧИ И ВКЛЮЧАЕТ ВОПРОСЫ,
СВЯЗАННЫЕ С ОТНОШЕНИЕМ ИНДИВИДОВ К СИТУАЦИЯМ ФИНАНСОВОГО ХАРАКТЕРА, СВЯЗАННЫМ С
РИСКОМ. ЗА КАЖДЫЙ ОТВЕТ, АССОЦИИРУЕМЫЙ С ПОВЫШЕННЫМ РИСКОМ, РЕСПОНДЕНТУ
НАЧИСЛЯЛСЯ ОДИН БАЛЛ. ЗАТЕМ ВЫЧИСЛЯЛОСЬ СУММАРНОЕ КОЛИЧЕСТВО БАЛЛОВ. ИНДИВИД БЫЛ
ОПРЕДЕЛЁН, КАК СКЛОННЫЙ К РИСКУ, ЕСЛИ ОН НАБРАЛ БОЛЬШЕ МЕДИАННОГО ЧИСЛА БАЛЛОВ
(ИСКЛЮЧАЯ САМО ЗНАЧЕНИЕ МЕДИАНЫ). ВСЕГО 33,98% ОПРОШЕННЫХ БЫЛИ ОХАРАКТЕРИЗОВАНЫ,
КАК СКЛОННЫЕ К ЭКОНОМИЧЕСКОМУ РИСКУ.

40.

• БЫЛО ВЫЯВЛЕНО, ЧТО ДЛЯ ОПРЕДЕЛЕНИЯ ПОВЫШЕННОЙ
ВЕРОЯТНОСТИ ТОГО, ЧТО РАБОТНИК МОЖЕТ ОКАЗАТЬСЯ
СКЛОННЫМ К РИСКУ, МОЖНО ИСПОЛЬЗОВАТЬ ПРОСТЫЕ
ВОПРОСЫ, СВЯЗАННЫЕ С МНЕНИЕМ ИНДИВИДА О ТОМ, КАКИЕ
КАЧЕСТВА ВАЖНЫ ДЛЯ УСПЕХА В ЖИЗНИ, ТАК КАК ОТВЕТЫ НА
НИХ КОРРЕЛИРУЮТ СО СКЛОННОСТЬЮ К РИСКУ. ДЛЯ
ВЫЯВЛЕНИЯ НАПРАВЛЕНИЯ И СТЕПЕНИ ИХ ВЛИЯНИЯ БЫЛА
ОЦЕНЕНА ЛОГИТ-МОДЕЛЬ, ПРЕДСТАВЛЕННАЯ В ТАБЛ. 1.
ЗАВИСИМАЯ ПЕРЕМЕННАЯ ПРИНИМАЕТ ЗНАЧЕНИЕ ЕДИНИЦЫ,
ЕСЛИ РЕСПОНДЕНТ СКЛОНЕН К РИСКУ, И НУЛЯ – ИНАЧЕ.
ФАКТОРНЫЕ ПЕРЕМЕННЫЕ ТАКЖЕ БИНАРНЫ.

41.

ТАБЛИЦА 1 – РЕЗУЛЬТАТЫ ОЦЕНКИ МОДЕЛИ
ЛОГИСТИЧЕСКОЙ РЕГРЕССИИ ДЛЯ СКЛОННОСТИ К РИСКУ
Качества, важные для успеха в жизни
хорошее образование, знания
работоспособность, трудолюбие
упорство в достижении поставленных целей
умение отстаивать свои интересы
готовность и склонность к риску
удача, везение
находчивость
нужные связи, знакомства
константа
English     Русский Rules