Анализ оттока телефонной компании для увеличения прибыли почти на 1 миллион долларов

Versão em Português aqui.

Для бизнеса нет более важной метрики, чем отток. Скорость, с которой клиенты покидают ваш бизнес и берут свои деньги в другом месте. Отток может быть вызван рядом факторов, и даже небольшое ежемесячное увеличение процента оттока может нанести ущерб бизнес-планированию, поэтому ключевым моментом является понимание того, какие факторы заставляют клиента отменить подписку.

Откровенно говоря: отток дорого обходится бизнесу. Высокая текучесть кадров заставляет компанию бороться со стрессом и трудностями, связанными с привлечением достаточного количества новых клиентов, чтобы заклеить дыры в корабле. Даже небольшое, на первый взгляд, увеличение коэффициента оттока (%) может быстро оказать большое негативное влияние на способность компании расти. Кроме того, высокие показатели оттока с большей вероятностью ухудшатся со временем.

Хотя вы можете попытаться преодолеть отток, сосредоточившись на привлечении новых клиентов, вы можете активно уменьшить отток, только сосредоточившись на областях, в которых вы теряете клиентов. Компании, которая теряет клиентов из-за плохой стратегии ценообразования, потребуется другая стратегия улучшения из-за неэффективной программы поддержки клиентов.

В этой работе мы увидим, что ежемесячные потери из-за оттока составляют примерно 2,9 миллиона долларов в месяц. С помощью нашего исследовательского анализа и рейтинговых моделей мы собираемся предсказать, что 65% клиентов откажутся от наших услуг. Если нам удастся достичь и обратить вспять отток хотя бы половины этих прогнозируемых клиентов с помощью эвристики, созданной в анализе, ежемесячная прибыль увеличится на 930 тысяч долларов в месяц.

Чтобы выяснить, откуда происходит отток клиентов в нашей телефонной компании, мы сначала проведем исследовательский анализ для создания эвристики, а затем создадим и оптимизируем модели машинного обучения, чтобы узнать, что нужно изменить и куда инвестировать, чтобы уменьшить отток.

Данные были извлечены из Kaggle, содержащего информацию о 100 000 абонентов телефонии, отличающихся фиктивным идентификатором и целевым оттоком, который имеет экземпляр между 31–60 днями после даты наблюдения.

Значения 100 переменных были взяты из этой статьи, а значения категориальных переменных выведены как можно лучше, исходя из английского языка.

На моем Гитхабе вы можете найти исследовательский анализ здесь, а тесты моделей классификации — здесь.

Ищите меня в других местах 🌎