Анализ и прогнозирование кредитоспособности клиентов Хоум Банка на основе методов машинного обучения
Актуальность
Объект и предмет исследования
Цель исследования
Задачи исследования
Структура
Анализ данных
Анализ данных
Обработка данных
Методы машинного обучения
ROC-кривые
Результаты
Заключение
2.78M
Category: financefinance

Анализ и прогнозирование кредитоспособности клиентов Хоум Банка на основе методов машинного обучения

1. Анализ и прогнозирование кредитоспособности клиентов Хоум Банка на основе методов машинного обучения

Выполнил: студент группы ПМИ-М-1-Д-2021-1 Панова Виктория
Геннадьевна
Руководитель: д.э.н., профессор Потехина Елена Витальевна
26.04.2024

2. Актуальность

Многие банки достаточно часто сталкиваются с риском
невозврата кредитов
Традиционные подходы к оценке кредитоспособности
часто субъективны и подвержены ошибкам
Финансовые учреждения собирают огромное количество
данных о заемщиках, включая транзакции, кредитную
историю, поведенческие данные
Банки и другие кредитные организации, внедряющие
машинное обучение, могут предложить более выгодные
условия для заемщиков и улучшить свои финансовые
показатели
2

3. Объект и предмет исследования

Объект исследования ВКР – финансовое учреждение Хоум Банк
Предмет исследования ВКР – методы и модели прогнозирования
кредитоспособности клиентов
3

4. Цель исследования

Целью данной дипломной работы является
разработка модели оценивания кредитоспособности
клиентов банка, основанной на существующих
методах прогнозирования с оценкой эффективности
их применения в различных условиях
4

5. Задачи исследования

Изучение теоретических
кредитоспособности
основ
анализа
и
прогнозирования
Анализ
существующих
алгоритмов
и
подходов
прогнозированию кредитоспособности заемщиков
к
Формирование выборки данных о заемщиках для проведения
исследования
Выбор и обоснование набора переменных, характеризующих
кредитоспособность заемщиков
Оценка эффективности предложенной системы и определение
перспектив её внедрения
5

6. Структура

Глава 1
Теоретические
основы
кредитования
Глава 2
Оценка
данных
и
анализ
Глава 3
Методы
прогнозирования
6

7. Анализ данных

7

8. Анализ данных

Тип данных
Количество столбцов
Вещественные числа
65
Целые числа
41
Категориальные данные
16
8

9. Обработка данных

Преобразование
категориальных данных
Заполнение
пропущенных значений
9

10. Методы машинного обучения

Логистическая
регрессия
Случайный лес
Градиентный бустинг
10

11. ROC-кривые

Логистическая
регрессия
Случайный лес
Градиентный бустинг
11

12. Результаты

С обработкой данных
Логистическая
Случайный лес Градиентный бустинг
регрессия
Доля верных
предсказаний
Точность
AUC
Скорость обучения
0,910002
0,920019
0,919937
0,53125
0,73
6 сек
0,846154
0,74
3 мин
0,811259
0,79
19 сек
Без обработки данных
Логистическая
Случайный лес Градиентный бустинг
регрессия
Доля верных
предсказаний
Точность
AUC
Скорость обучения
0,887802
0,915619
0,904032
0,323997
0,64
3 сек
0,546154
0,67
1 мин 56 сек
0,672389
0,69
13 сек
12

13. Заключение

Обработаны данные о клиентах банка, проведен предварительный
анализ данных, выявлены ключевые факторы, влияющие на
кредитоспособность клиентов
Рассмотрены и протестированы различные методы машинного
обучения, включая логистическую регрессию, случайный лес и
градиентный бустинг
На основе сравнительного анализа моделей было выбрано
оптимальное решение для прогнозирования кредитоспособности
клиентов
Разработаны рекомендации для банка по улучшению процесса
оценки кредитоспособности на основе полученных результатов
Обозначены направления для дальнейших исследований и
улучшений, включая расширение набора данных, использование
более сложных моделей и интеграцию с существующими системами
банка
13
English     Русский Rules