Similar presentations:
Анализ и прогнозирование кредитоспособности клиентов Хоум Банка на основе методов машинного обучения
1. Анализ и прогнозирование кредитоспособности клиентов Хоум Банка на основе методов машинного обучения
Выполнил: студент группы ПМИ-М-1-Д-2021-1 Панова ВикторияГеннадьевна
Руководитель: д.э.н., профессор Потехина Елена Витальевна
26.04.2024
2. Актуальность
Многие банки достаточно часто сталкиваются с рискомневозврата кредитов
Традиционные подходы к оценке кредитоспособности
часто субъективны и подвержены ошибкам
Финансовые учреждения собирают огромное количество
данных о заемщиках, включая транзакции, кредитную
историю, поведенческие данные
Банки и другие кредитные организации, внедряющие
машинное обучение, могут предложить более выгодные
условия для заемщиков и улучшить свои финансовые
показатели
2
3. Объект и предмет исследования
Объект исследования ВКР – финансовое учреждение Хоум БанкПредмет исследования ВКР – методы и модели прогнозирования
кредитоспособности клиентов
3
4. Цель исследования
Целью данной дипломной работы являетсяразработка модели оценивания кредитоспособности
клиентов банка, основанной на существующих
методах прогнозирования с оценкой эффективности
их применения в различных условиях
4
5. Задачи исследования
Изучение теоретическихкредитоспособности
основ
анализа
и
прогнозирования
Анализ
существующих
алгоритмов
и
подходов
прогнозированию кредитоспособности заемщиков
к
Формирование выборки данных о заемщиках для проведения
исследования
Выбор и обоснование набора переменных, характеризующих
кредитоспособность заемщиков
Оценка эффективности предложенной системы и определение
перспектив её внедрения
5
6. Структура
Глава 1Теоретические
основы
кредитования
Глава 2
Оценка
данных
и
анализ
Глава 3
Методы
прогнозирования
6
7. Анализ данных
78. Анализ данных
Тип данныхКоличество столбцов
Вещественные числа
65
Целые числа
41
Категориальные данные
16
8
9. Обработка данных
Преобразованиекатегориальных данных
Заполнение
пропущенных значений
9
10. Методы машинного обучения
Логистическаярегрессия
Случайный лес
Градиентный бустинг
10
11. ROC-кривые
Логистическаярегрессия
Случайный лес
Градиентный бустинг
11
12. Результаты
С обработкой данныхЛогистическая
Случайный лес Градиентный бустинг
регрессия
Доля верных
предсказаний
Точность
AUC
Скорость обучения
0,910002
0,920019
0,919937
0,53125
0,73
6 сек
0,846154
0,74
3 мин
0,811259
0,79
19 сек
Без обработки данных
Логистическая
Случайный лес Градиентный бустинг
регрессия
Доля верных
предсказаний
Точность
AUC
Скорость обучения
0,887802
0,915619
0,904032
0,323997
0,64
3 сек
0,546154
0,67
1 мин 56 сек
0,672389
0,69
13 сек
12
13. Заключение
Обработаны данные о клиентах банка, проведен предварительныйанализ данных, выявлены ключевые факторы, влияющие на
кредитоспособность клиентов
Рассмотрены и протестированы различные методы машинного
обучения, включая логистическую регрессию, случайный лес и
градиентный бустинг
На основе сравнительного анализа моделей было выбрано
оптимальное решение для прогнозирования кредитоспособности
клиентов
Разработаны рекомендации для банка по улучшению процесса
оценки кредитоспособности на основе полученных результатов
Обозначены направления для дальнейших исследований и
улучшений, включая расширение набора данных, использование
более сложных моделей и интеграцию с существующими системами
банка
13
finance