4.70M

Итоговый+проект_АнД-806_Сухомлинова

1.

Федеральное государственное автономное образовательное
учреждение высшего образования
«Национальный исследовательский Томский государственный университет»
Дополнительная профессиональная программа профессиональной
переподготовки
Аналитик данных: с нуля до разработки прикладных решений для бизнеса
Итоговый проект
Сегментация клиентской базы
телекоммуникационной
компании
Выполнил: Сухомлинова Инна
Викторовна
Номер потока: АнД-806
Преподаватель: Строев Сергей
Павлович

2.

Постановка задачи:
➜Аналитическая задача – провести анализ данных
с целью выделения наиболее типичных групп
клиентов и разработки предложений для каждой
из групп

3.

,,,,,,
Исходные данные:
Каждый клиент описывается следующим набором признаков:
- Возраст;
- Среднемесячный расход;
- Средняя продолжительность разговоров;
- Звонков днем за месяц;
- Звонков вечером за месяц;
- Звонков ночью за месяц;
- Звонки в другие города;
- Звонки в другие страны;
- Доля звонков на стационарные телефоны;
- Количество SMS за месяц;
- Дата подключения тарифа.

4.

Чтение и профилирование данных
Чтение данных, информация о наборе

5.

Чтение и профилирование данных
Описательные статистики, результаты профилирования

6.

Предобработка данных
Корректировка заголовков
Корректировка типов

7.

Предобработка данных
Поиск и обработка дублей, аномальных значений, пропусков, добавление новых переменных, конвертация типов данных

8.

Исследовательский анализ данных:
1.
в разрезе значений признаков Год подключения, Месяц подключения, Дата подключения исследовать:
-
динамику подключения к тарифам (количество клиентов).
-
Построить графики.
-
В какой год, месяц и день подключались меньше/больше всего клиентов? Какие выводы можно сделать?
2.
в разрезе значений признака Возрастная категория исследовать распределение признаков Среднемесячный
расход, Средняя продолжительность разговоров, Звонков днем за месяц, Звонков вечером за месяц, Звонков ночью за
месяц, Звонки в другие города, Доля звонков на стационарные телефоны, Количество SMS за месяц.
-
Для каждого из признаков рассчитать выборочное среднее, медиану и моду.
-
Построить графики.
-
Какие выводы можно сделать о предпочтениях клиентов разных возрастных категорий в отношении используемых услуг
(звонков и SMS; времени суток);
3.
клиенты каких возрастных категорий (ТОП-2):
-
больше всего в среднем в месяц тратят на оплату услуг связи;
-
больше всего тратят времени на общение в месяц днем, вечером и ночью;
-
больше всего по количеству звонков в месяц днем, вечером и ночью. Совпадают ли результаты с предыдущем пунктом;
4.
с помощью диаграмм рассеивания исследовать зависимости между признаками Среднемесячный расход,
Средняя продолжительность разговоров, Звонков днем за месяц, Звонков вечером за месяц, Звонков ночью за месяц,
Звонки в другие города, Доля звонков на стационарные телефоны, Количество SMS за месяц. Какие выводы можно сделать?

9.

1. в разрезе значений признаков Год подключения,
Месяц подключения, Дата подключения
исследовать в разрезе значений признаков год
подключения, Месяц подключения, Дата
подключения исследовать: динамику
подключения к тарифам (количество клиентов).
Построить графики. В какой год, месяц и день
подключались меньше/больше всего клиентов?
Какие выводы можно сделать?
2. в разрезе значений признака Возрастная категория исследовать
распределение признаков Среднемесячный расход, Средняя
продолжительность разговоров, Звонков днем за месяц, Звонков
вечером за месяц, Звонков ночью за месяц, Звонки в другие города, Доля
звонков на стационарные телефоны, Количество SMS за месяц. Для
каждого из признаков рассчитать выборочное среднее, медиану и моду.
Построить графики. Какие выводы можно сделать о предпочтениях
клиентов разных возрастных категорий в отношении используемых
услуг (звонков и SMS; времени суток);

10.

11.

12.

3.
клиенты каких возрастных категорий (ТОП-2): больше всего в среднем в месяц
тратят на оплату услуг связи; больше всего тратят времени на общение в месяц
днем, вечером и ночью; больше всего по количеству звонков в месяц днем,
вечером и ночью. Совпадают ли результаты с предыдущем пунктом;
4.
с помощью диаграмм рассеивания исследовать зависимости между
признаками Среднемесячный расход, Средняя продолжительность
разговоров, Звонков днем за месяц, Звонков вечером за месяц, Звонков
ночью за месяц, Звонки в другие города, Доля звонков на стационарные
телефоны, Количество SMS за месяц. Какие выводы можно сделать?

13.

Подготовлен и опубликован дашборд с данными о медианном значении распределения некоторых признаков, отраженными в разрезе значений
признака возрастная категория.] (https://datalens.yandex.cloud/m03b0qmcswoq9)

14.

Результаты и выводы:
Проведен анализ данных.
Выделены наиболее типичные возрастные группы клиентов: "студент", "аспирант", "бизнесмен" и "знаток".
При разработке предложений для каждой из групп возможно применение стратегии дифференцированного
ценообразования, которая предусматривает установления тарифов на одноименные услуги по определенным
потребительским сегментам и применение скидок в зависимости от времени и интенсивности потребления
услуг конкретными абонентами.
Это позволит дифференцировать тарифы на ряд услуг связи по группам абонентов:
1.
"студент" - льготные расценки на звонки в вечернее время, СМС; "аспирант" - льготы на вечерние,
междугородные звонки, СМС; Это может привести к повышению доступности услуг для абонентов с невысокой
платежеспособностью, поскольку они являются основными потребителями услуг в часы спада нагрузки.
2.
"бизнесмен" и "знаток" - льготы на вечерние и ночные звонки способствуют сглаживанию
неравномерности нагрузки и более равномерному использованию производственных мощностей, стимулируют
эти группы более активно обращаться к средствам связи, снижая при этом свои затраты.
И в первом, и во втором случаях компания не несет потери доходов, поскольку применение льготных тарифов
увеличивает трафик.
Таким образом, цель работы достигнута.

15.

Спасибо
за внимание!
English     Русский Rules