Similar presentations:
Построение модели прогнозирования вероятностей банкротства банков с помощью логистической регрессии
1. Выпускная работа «Построение модели прогнозирования вероятностей банкротства банков с помощью логистической регрессии»
ВЫПУСКНАЯ РАБОТА«ПОСТРОЕНИЕ МОДЕЛИ
ПРОГНОЗИРОВАНИЯ ВЕРОЯТНОСТЕЙ
БАНКРОТСТВА БАНКОВ С ПОМОЩЬЮ
ЛОГИСТИЧЕСКОЙ РЕГРЕССИИ»
Выполнила:
студентка 42 группы
Егорова О. А.
Научный руководитель:
к. ф-м. н.
Архипов С. В.
2. Цель и Задачи выпускной работы
ЦЕЛЬ И ЗАДАЧИ ВЫПУСКНОЙ РАБОТЫЦель:
Построить модель прогнозирования
вероятностей банкротства банков с помощью
логистической регрессии.
Построение модели логистической регрессии
включает следующие этапы:
1) построение модели;
2) оценка качества модели;
3) проверка гипотез;
4) выявление ошибок спецификации модели;
2
3. Цель и Задачи выпускной работы
ЦЕЛЬ И ЗАДАЧИ ВЫПУСКНОЙ РАБОТЫЗадачи:
1.
Изучение принципа построения модели
логистической регрессии и ее применимость к
решению задачи изучения банкротства банков РФ.
2.
Сбор, обработка и анализ статистического
материала.
3. Построение модели логистической регрессии с
помощью статистического пакета Eviews.
4.
Проверка модели на адекватность.
5.
Интерпретация полученных результатов.
6.
Разработка
программы,
вычисляющей
вероятность разорения для любого банка.
3
4. Банковская система российской федерации
БАНКОВСКАЯ СИСТЕМА РОССИЙСКОЙФЕДЕРАЦИИ
Банковская система
ЦБ РФ
Коммерческие банки
Клиентские
банки
Розничные
банки
Расчётные
банки
Кредитные
банки
Дифференцированные банки
Капитализированные
монобанки
Корпоративные
кредиторы
Более
900
банков
Универсальные банки
Розничные
кредиторы
Рис. 1 Схема банковской системы РФ
4
5. Сбор исходной информации
СБОР ИСХОДНОЙ ИНФОРМАЦИИВ качестве источника
информации о банках РФ
был выбран сайт banki.ru.
Для
выкачивания
информации
была
разработана автоматическая
система
сбора
и
структурирования данных,
написанная на языке Ruby.
Рис. 2 Листинг сайта banki.ru
Для построения структуры банковской системы было
выкачано 15 показателей 860 банков за апрель 2013 года.
5
6. Система автоматического сбора
СИСТЕМА АВТОМАТИЧЕСКОГО СБОРАbanki.ru
Скрипт на Ruby
Генератор
таблиц
База
данных
Sqlite
Таблицы
CSV
Статистический
пакет R
Файлы
на диске
Парсер
библиотекой
Nokogiri
6
7. Первичная информация
ПЕРВИЧНАЯ ИНФОРМАЦИЯПосле отработки системы автоматического выкачивания и обработки
полученной информации было получено 15 показателей по 800 банкам
России.
показатель
обозначение
Капитал
x1
Чистая прибыль
x2
Кредитный портфель
x3
Вклады физических лиц
x4
Вложения в ценные бумаги
x5
Высоколиквидные активы
x6
Выданные мбк
x7
Вложения в капиталы других
x8
Основные средства и мат. активы
x9
Прочие активы
x10
Кредиты физ. лиц
x11
Кредиты юр. лиц
x12
Средства предприятий
x13
Привлеченные мбк
x14
Выпущенные облигации и векселя
x15
Рис. 3 Основные банковские показатели
7
8. Анализ информации
АНАЛИЗ ИНФОРМАЦИИВыделены банки
,ориентированные на
выдачу кредита юр.
лицам
Исключены банки, с
показателем чистой
прибыли свыше 500 000
тыс. руб.
Частная модель
Общая модель
Исключены крупные банки
Выкачанные данные
Рис. 4 Этапы анализа информации
8
9. Построение Моделей логистической регрессии
ПОСТРОЕНИЕ МОДЕЛЕЙ ЛОГИСТИЧЕСКОЙРЕГРЕССИИ
Логистическая регрессия (англ. logit model) — это статистическая модель,
используемая для предсказания вероятности возникновения некоторого события путём
подгонки данных к логистической кривой.
Расчет ведется по следующей формуле:
1 x1+…+