2.04M
Categories: mathematicsmathematics educationeducation

Тестирование адекватности модели линейной регрессии согласно общей схеме. Определение факторов, влияющих на отчисление студентов

1.

Тестирование адекватности
модели линейной регрессии
согласно общей схеме
Определение факторов, влияющих на
отчисление студентов
Белов М. С.
Климов А. О.
Подсадный В. А.
Рахманова Д. М.
Сан-Оол М. М.
Селивонец Е. С.
Студенты группы: 211-365
Преподаватель: Царькова Н. И.

2.

Актуальность
проблемы
Проблема
Отчисление – проблема, которая
имеет неоднозначные причины
возникновения
Определение отчисления
Трудности исследования
Часто отчисление анализируется в
исследовательской литературе на
основе времени: раннее или позднее.
Из-за различий в отчетах невозможно
сравнить показатели отчисления в
разных учреждениях.
Доля учащихся, которые бросили
учебу, варьируется между
разными исследованиями в
зависимости от источника
данных, методов расчета и
того, как определяется
отчисление.
15% Студентов отчисляются из
ВУЗов после первой сессии
2

3.

Цели и задачи
3

4.

Цели и задачи
Выполнить
предобработку данных
4

5.

Цели и задачи
Выполнить
предобработку данных
Найти общий вид
линейной регрессии и
описать входящие в
нее переменные
5

6.

Цели и задачи
Выполнить
предобработку данных
Найти общий вид
линейной регрессии и
описать входящие в
нее переменные
Протестировать модель
на адекватность
6

7.

Цели и задачи
Выполнить
предобработку данных
Найти общий вид
линейной регрессии и
описать входящие в
нее переменные
Протестировать модель
на адекватность
Проанализировать
полученные результаты
7

8.

Цели и задачи
Выполнить
предобработку данных
Найти общий вид
линейной регрессии и
описать входящие в
нее переменные
Протестировать модель
на адекватность
Определить,
какие
факторы в большей
степени влияют на
результат
Проанализировать
полученные результаты
8

9.

Цели и задачи
Выполнить
предобработку данных
Найти общий вид
линейной регрессии и
описать входящие в
нее переменные
Сделать
прогноз
для
проверки
точности
предсказаний
Определить,
какие
факторы в большей
степени влияют на
результат
Протестировать модель
на адекватность
Проанализировать
полученные результаты
9

10.

Цели и задачи
Сделать выводы
о
полученных
результатах
Сделать
прогноз
для
проверки
точности
предсказаний
Определить,
какие
факторы в большей
степени влияют на
результат
Выполнить
предобработку данных
Найти общий вид
линейной регрессии и
описать входящие в
нее переменные
Протестировать модель
на адекватность
Проанализировать
полученные результаты
10

11.

Теоретическое
Экономические факторы
0
1
ВВП, уровень инфляции,
уровень безработицы
Социальные факторы
02
Семейное положение, особые
потребности, гендер и др.
03
04
Учебные факторы
Средний балл, количество
дисциплин, специальность и др.
Индивидуальные факторы
Род занятий родителей, возраст
при зачислении и др.
11

12.

Этапы работы
Построение модели
в Python
Прогноз в Excel
Предварительный
анализ данных
12

13.

Устранение корреляции
Матрица корреляции
13
«ДО»

14.

Устранение корреляции
Матрица корреляции
«ПОСЛЕ»
14

15.

Построение модели
Набор данных
Тестовая выборка
Обучающая выборка
15

16.

Итоговые
показатели модели
Model:
OLS
Adj. Rsquared:
Coef.
Std.Err.
t
P>|t|
[0.025
0.975]
0.488
Intercept
-1.0157
0.0687
-14.7743
0.0000
-1.1505
-0.8809
-0.0061
0.0013
-4.7210
0.0000
-0.0086
-0.0035
AIC:
2536.2953
Способ_
поступл
ения_X2
-0.0072
0.0015
-4.9051
0.0000
-0.0100
-0.0043
2610.1148
Специал
ьность_
X4
Дневное
Вечерне
е_посещ
ение_X5
-0.0525
0.0196
-2.6836
0.0073
-0.0909
-0.0142
Должник
_X11
-0.1109
0.0209
-5.3160
0.0000
-0.1518
-0.0700
Актуаль
ность_о
платы_о
бучения
_X12
0.3191
0.0204
15.6529
0.0000
0.2791
0.3591
Пол_X13
-0.0978
0.0131
-7.4404
0.0000
-0.1236
-0.0720
Стипенд
иат_X14
0.1581
0.0141
11.2225
0.0000
0.1304
0.1857
-0.0098
0.0016
-6.0260
0.0000
-0.0129
-0.0066
Dependent
Variable:
Итог_Y
Date:
2023-04-09
12:41
BIC:
No.
Observation
s:
3469
LogLikelihood:
Df Model:
11
F-statistic:
301.7
Df
Residuals:
3457
Prob (Fstatistic):
0.00
R-squared:
0.490
Scale:
0.12121
-1256.1
2.037
Возраст
_при_за
числени
и_X15
Omnibus:
181.878
DurbinWatson:
Prob(Omnibus
):
0.000
Jarque-Bera
(JB):
210.991
Иностра
нец_X16
0.1108
0.0398
2.7811
0.0054
0.0327
0.1890
Skew:
-0.604
Prob(JB):
0.000
0.0168
0.0033
5.1100
0.0000
0.0104
0.0233
3.029 Condition No.:
332
Пройден
ные_дис
циплин
ы_X17
Средний
_балл_X
19
0.1301
0.0041
31.7080
0.0000
0.1221
0.1382
Kurtosis:
16

17.

Результат
проекта
Прогноз
Результатом проекта
выступил прогноз
отчислений студентов
1
Средний балл
2
Актуальность
оплаты обучения
3
Стипендиат
86%
4
Точность предсказаний
модели
5
Ранжирование факторов
Было выяснено, какие факторы
и с какой силой влияют на
успешность окончания
студентом университета
Должник
6
Пройденные
дисциплины
7
Специальность
8
Пол
Способ
поступления
9
Возраст при
зачислении
Иностранец
1
0
17

18.

Белов М. С.
Климов А. О.
Подсадный В. А.
Рахманова Д. М.
Сан-Оол М. М.
Селивонец Е. С.
Студенты группы: 211-365
Преподаватель: Царькова Н. И.
English     Русский Rules