Similar presentations:
Тестирование адекватности модели линейной регрессии согласно общей схеме. Определение факторов, влияющих на отчисление студентов
1.
Тестирование адекватностимодели линейной регрессии
согласно общей схеме
Определение факторов, влияющих на
отчисление студентов
Белов М. С.
Климов А. О.
Подсадный В. А.
Рахманова Д. М.
Сан-Оол М. М.
Селивонец Е. С.
Студенты группы: 211-365
Преподаватель: Царькова Н. И.
2.
Актуальностьпроблемы
Проблема
Отчисление – проблема, которая
имеет неоднозначные причины
возникновения
Определение отчисления
Трудности исследования
Часто отчисление анализируется в
исследовательской литературе на
основе времени: раннее или позднее.
Из-за различий в отчетах невозможно
сравнить показатели отчисления в
разных учреждениях.
Доля учащихся, которые бросили
учебу, варьируется между
разными исследованиями в
зависимости от источника
данных, методов расчета и
того, как определяется
отчисление.
15% Студентов отчисляются из
ВУЗов после первой сессии
2
3.
Цели и задачи3
4.
Цели и задачиВыполнить
предобработку данных
4
5.
Цели и задачиВыполнить
предобработку данных
Найти общий вид
линейной регрессии и
описать входящие в
нее переменные
5
6.
Цели и задачиВыполнить
предобработку данных
Найти общий вид
линейной регрессии и
описать входящие в
нее переменные
Протестировать модель
на адекватность
6
7.
Цели и задачиВыполнить
предобработку данных
Найти общий вид
линейной регрессии и
описать входящие в
нее переменные
Протестировать модель
на адекватность
Проанализировать
полученные результаты
7
8.
Цели и задачиВыполнить
предобработку данных
Найти общий вид
линейной регрессии и
описать входящие в
нее переменные
Протестировать модель
на адекватность
Определить,
какие
факторы в большей
степени влияют на
результат
Проанализировать
полученные результаты
8
9.
Цели и задачиВыполнить
предобработку данных
Найти общий вид
линейной регрессии и
описать входящие в
нее переменные
Сделать
прогноз
для
проверки
точности
предсказаний
Определить,
какие
факторы в большей
степени влияют на
результат
Протестировать модель
на адекватность
Проанализировать
полученные результаты
9
10.
Цели и задачиСделать выводы
о
полученных
результатах
Сделать
прогноз
для
проверки
точности
предсказаний
Определить,
какие
факторы в большей
степени влияют на
результат
Выполнить
предобработку данных
Найти общий вид
линейной регрессии и
описать входящие в
нее переменные
Протестировать модель
на адекватность
Проанализировать
полученные результаты
10
11.
ТеоретическоеЭкономические факторы
0
1
ВВП, уровень инфляции,
уровень безработицы
Социальные факторы
02
Семейное положение, особые
потребности, гендер и др.
03
04
Учебные факторы
Средний балл, количество
дисциплин, специальность и др.
Индивидуальные факторы
Род занятий родителей, возраст
при зачислении и др.
11
12.
Этапы работыПостроение модели
в Python
Прогноз в Excel
Предварительный
анализ данных
12
13.
Устранение корреляцииМатрица корреляции
13
«ДО»
14.
Устранение корреляцииМатрица корреляции
«ПОСЛЕ»
14
15.
Построение моделиНабор данных
Тестовая выборка
Обучающая выборка
15
16.
Итоговыепоказатели модели
Model:
OLS
Adj. Rsquared:
Coef.
Std.Err.
t
P>|t|
[0.025
0.975]
0.488
Intercept
-1.0157
0.0687
-14.7743
0.0000
-1.1505
-0.8809
-0.0061
0.0013
-4.7210
0.0000
-0.0086
-0.0035
AIC:
2536.2953
Способ_
поступл
ения_X2
-0.0072
0.0015
-4.9051
0.0000
-0.0100
-0.0043
2610.1148
Специал
ьность_
X4
Дневное
Вечерне
е_посещ
ение_X5
-0.0525
0.0196
-2.6836
0.0073
-0.0909
-0.0142
Должник
_X11
-0.1109
0.0209
-5.3160
0.0000
-0.1518
-0.0700
Актуаль
ность_о
платы_о
бучения
_X12
0.3191
0.0204
15.6529
0.0000
0.2791
0.3591
Пол_X13
-0.0978
0.0131
-7.4404
0.0000
-0.1236
-0.0720
Стипенд
иат_X14
0.1581
0.0141
11.2225
0.0000
0.1304
0.1857
-0.0098
0.0016
-6.0260
0.0000
-0.0129
-0.0066
Dependent
Variable:
Итог_Y
Date:
2023-04-09
12:41
BIC:
No.
Observation
s:
3469
LogLikelihood:
Df Model:
11
F-statistic:
301.7
Df
Residuals:
3457
Prob (Fstatistic):
0.00
R-squared:
0.490
Scale:
0.12121
-1256.1
2.037
Возраст
_при_за
числени
и_X15
Omnibus:
181.878
DurbinWatson:
Prob(Omnibus
):
0.000
Jarque-Bera
(JB):
210.991
Иностра
нец_X16
0.1108
0.0398
2.7811
0.0054
0.0327
0.1890
Skew:
-0.604
Prob(JB):
0.000
0.0168
0.0033
5.1100
0.0000
0.0104
0.0233
3.029 Condition No.:
332
Пройден
ные_дис
циплин
ы_X17
Средний
_балл_X
19
0.1301
0.0041
31.7080
0.0000
0.1221
0.1382
Kurtosis:
16
17.
Результатпроекта
Прогноз
Результатом проекта
выступил прогноз
отчислений студентов
1
Средний балл
2
Актуальность
оплаты обучения
3
Стипендиат
86%
4
Точность предсказаний
модели
5
Ранжирование факторов
Было выяснено, какие факторы
и с какой силой влияют на
успешность окончания
студентом университета
Должник
6
Пройденные
дисциплины
7
Специальность
8
Пол
Способ
поступления
9
Возраст при
зачислении
Иностранец
1
0
17
18.
Белов М. С.Климов А. О.
Подсадный В. А.
Рахманова Д. М.
Сан-Оол М. М.
Селивонец Е. С.
Студенты группы: 211-365
Преподаватель: Царькова Н. И.