Нелинейная регрессия
Может быть так, что зависимость между переменными нелинейная. Тогда применяем нелинейную регрессию
Логистическая регрессия
Математическая модель
Математическая модель
Математическая модель
Математическая модель
Логистическая регрессия
Логистическая регрессия
Логистическая регрессия
Пример
Пример
Результаты
Результаты
Качество модели
Качество модели
Качество модели
Результаты
Регрессионные коэффициенты
Результаты
Результаты
Результаты
Результаты
Результаты
Результаты
Результаты
Тогда применяем нелинейную регрессию, а зависимость может быть задана самим пользователем
Пример. Рост населения в США с 1790 по 1960 гг по декадам:
Для построения уравнений нелинейной регрессии служит модуль Nonlinear Estimation
Для построения уравнений нелинейной регрессии служит модуль Nonlinear Estimation
Оценка параметров
Оценка модели
Оценка модели
Оценка модели
Оценка модели
Оценка модели
Оценка модели
Оценка модели
Оценка модели
Оценка модели
858.00K
Category: mathematicsmathematics

Нелинейная регрессия

1. Нелинейная регрессия

Cтат. методы в
психологии
(Радчикова Н.П.)
Trisha Klass Illinois State University

2. Может быть так, что зависимость между переменными нелинейная. Тогда применяем нелинейную регрессию

Регрессия
линейная
простая
множественная
нелинейная
логистическая
...

3.

Бинарная логистическая регрессия
позволяет исследовать зависимость
дихотомических зависимых
переменных от независимых
переменных, имеющих любой вид
шкалы

4.

Бинарная логистическая регрессия от
дискриминантного анализа отличается
тем, что связь между зависимой и
независимыми переменными
нелинейная

5. Логистическая регрессия

Мы говорим о некотором событии,
которое может произойти или не
произойти. В этом случае вероятность
наступления события рассматривается в
зависимости от значений независимых
переменных.

6. Математическая модель

p
где
1
1 e
z
z=b1x1+b2x2+ …+bnxn+ b0
p – вероятность наступления события, x –
независимые переменные
Если р больше 0.5, то можно
предположить, что событие произойдет.

7. Математическая модель

p
где
1
1 e
z
z=b1x1+b2x2+ …+bnxn+b0
Наша задача, как всегда, - оценить
коэффициенты bi

8. Математическая модель

Зависимость, связывающая вероятность
события и величину Z, показана на
следующей диаграмме:
Эта зависимость носит нелинейный
характер, причем P не может выходить за
пределы диапазона 0 — 1

9. Математическая модель

10. Логистическая регрессия

Находится в модуле
Nonlinear Estimation

11. Логистическая регрессия

Вот она!

12. Логистическая регрессия

Как обычно, надо
выбрать
переменные

13. Пример

Рассмотрим пример из медицины (Breast
cancer survival.sta)
Оценим шанс на выживание пациентов
разного возраста с опухолью различных
размеров (две независимые переменные)

14. Пример

Age –
Age (years)
Pathsize - Pathologic Tumor Size (cm)
Lnpos -
Positive Axillary Lymph Nodes

Status – Censored/Died

15. Результаты

16. Результаты

Оценка качества
модели

17. Качество модели

Качество приближения регрессионной
модели оценивается при помощи функции
подобия. Мерой правдоподобия служит
отрицательное удвоение значения
логарифма этой функции - -2LL.
В качестве начального значения для -2LL
принимается значение, которое получается
для регрессионной модели, содержащей
только константу.

18. Качество модели

Затем в модель добавляют переменные
согласно выбранному методу и
вычисляют разность (улучшение
качества модели). Разность
обозначают как хи-квадрат и
вычисляют ее значимость.

19. Качество модели

Хи-квадрат

20. Результаты

Коэффициенты b

21. Регрессионные коэффициенты

22. Результаты

Эмпирические,
предсказанные
значения и остатки

23. Результаты

24. Результаты

Матрица
классификации

25. Результаты

26. Результаты

Распределение
остатков

27. Результаты

28. Результаты

Знакомые нам
графики
оценки

29.

А если у
меня такая
зависимость,
какую я сам
придумал ?!

30.

p
h(t)h'
c
1 e ia bt
log cov(h(t)g(
c
t)n 1 e
Оценка на экзамене и
мотивация так прямо не
связаны …
a bt

31. Тогда применяем нелинейную регрессию, а зависимость может быть задана самим пользователем

Регрессия
Тогда
применяем
нелинейную
регрессию,
а зависимость
может быть
задана самим
пользователем
линейная
простая
множественная
нелинейная
логистическая
...

32. Пример. Рост населения в США с 1790 по 1960 гг по декадам:

D EC AD E vs. POPU L
POPU L = -23,44 + 10,091 * D EC AD E
C orrelation: r = ,96216
220
Видно, что зависимость тут
скорее не линейная, а
экспоненциальная.
Демографы знают, что
лучше всего зависимость
роста населения от времени
описывается функцией
180
POPUL
140
100
60
20
-20
-2
2
6
10
D EC AD E
14
18
22
R eg ression
95% confid.
population
c
a bt
1 e

33.

Очевидно, что нашей задачей
является определение трех
коэффициентов - a, b и c.

34. Для построения уравнений нелинейной регрессии служит модуль Nonlinear Estimation

35. Для построения уравнений нелинейной регрессии служит модуль Nonlinear Estimation

Тут набираем
формулу,
которая, по
нашему
мнению,
хорошо
описывает
полученную
зависимость

36.

Маленькие (?) хитрости
Начальные
значения
для
параметров

37.

Маленькие (?) хитрости

38.

Получаем
результаты!

39. Оценка параметров

40.

Теперь,
подставив коэффициенты
в исходную формулу
population
244
3, 89 0 , 28t
1 e
,
мы можем оценить население
США в будущем - через 19, 20,
1000 лет…

41. Оценка модели

Процент
объясненной
дисперсии

42. Оценка модели

Остатки

43. Оценка модели

Эмпирические,
предсказанные
значения и
остатки

44. Оценка модели

Гистограмма
распределения
остатков

45. Оценка модели

Распределение должно быть как
можно ближе к нормальному

46. Оценка модели

Тоже
Гистограмма
знакомые
распределения
нам графики
остатков

47. Оценка модели

Эти значения должны лежать вдоль
одной прямой

48. Оценка модели

График эмпирических
значений и функции,
описывающей модель

49. Оценка модели

50.

Вот и все!
Задавайте любые зависимости
и проверяйте любые модели!
English     Русский Rules