miércoles, 1 de junio de 2016

Análisis de cohortes aplicado al churn

Érase un operador de telecomunicaciones incumbente llamado Telefónica, que a finales de los 90 hubo de salir de su zona de confort para enfrentarse por primera vez a la competencia. Sus rivales entonces eran Retevisión y Uni2, y el cliente a disputarse entre todos el usuario de telefonía fija.

Vamos a desempolvar una herramienta visual muy sencilla pero a la vez potente, que empleaba por aquel entonces junto a mi jefe Pablo para saber con precisión cuándo el operador dominante merodeaba la cartera de Uni2. Por supuesto cualquier parecido de las cifras con la realidad vivida será pura coincidencia.



Un análisis de cohortes consiste en un estudio grupal en el que se realiza un seguimiento de conjuntos de individuos con características comunes (las cohortes). En el terreno que nos ocupa, esta técnica es ideal para analizar la evolución en el tiempo del churn, el ingreso, o cualquier otro parámetro asociado al ciclo de vida del cliente.

Tomaremos como variable compartida la fecha del alta, lo que equivale a definir cohortes de clientes con la misma antigüedad en nuestra cartera.

La primera fila representa la captación en cada uno de los meses del año durante un período de estudio que va de enero de 2000 a junio de 2001. Sustrayendo paulatinamente las bajas, evolucionamos mes a mes los cierres de cada una de estas carteras parciales o cohortes (hacer clic para ampliar):



Si ahora cada una de las disminuciones parciales de cartera la convertimos en una tasa de bajas mensual respecto a la cartera precedente, obtenemos una tabla sumamente interesante (hacer clic para ampliar):



Esta forma de disponer los valores de churn permite detectar visualmente dos tipos de pautas:
  • Por filas aparecerán patrones en aquellos meses relativos al alta del cliente en los que por algún motivo la tasa de bajas cambie.
  • Por diagonales detectaremos eventos masivos puntuales que afecten a todas las cohortes simultáneamente en un mes absoluto concreto.

Como puede verse en nuestro caso tenemos ambos efectos:
  • En los meses 7 y 8 relativos al alta, la tasa de bajas es notablemente superior a la del resto de meses. El motivo obviamente no es que todos los clientes se pongan de acuerdo para abandonarnos en ese preciso momento, sino que la competencia está haciendo actuar su maquinaria winback preferentemente a los 7-8 meses de haber perdido a los clientes. Descubrir este fenómeno resulta de gran valor porque nos permitirá concentrar los esfuerzos de fidelización en blindar a aquellos clientes cercanos a iniciar su séptimo mes de vida.
  • Por otro lado podemos ver que ha tenido lugar algún tipo de evento puntual masivo, seguramente debido a alguna promoción ATL de gran impacto llevada a cabo en el mercado, que ha elevado el churn de toda la diagonal correspondiente a las bajas de abril de 2001.

En las columnas de la derecha se ha calculado la tasa de bajas promedio para cada mes de antigüedad de cliente. Para ello hemos usado dos métodos: una media ponderada por los pesos de las carteras participantes y un cálculo de mediana que, como vimos en 'La mediana, el devorador de outliers', servirá para eliminar si lo deseamos el efecto extraordinario de lo ocurrido en abril de 2001.

En la siguiente gráfica podemos ver cómo el cálculo de mediana reduce la estimación de tasa de bajas mensual hecha usando la media, sustrayendo del perfil de churn el efecto del cisne negro. La diferencia no es grande al disponer de un histórico amplio que diluye el efecto del evento.



Quedándonos con el perfil obtenido con el cálculo por mediana, y con una estimación de cola de churn estructural mensual de un 1,72%, el tiempo de vida medio de la cartera resulta de 48,9 meses o 4,08 años, lo que equivale a un modelo ideal de churn constante de un 2,02% mensual o 21,7% anual.



En el archivo analisis_cohortes.xslx pueden encontrarse todos los datos y cálculos usados en el ejemplo. Tanto las relaciones entre el churn y el tiempo de vida medio como las anualizaciones, se han hecho huyendo de aproximaciones tal y como se explicaba en 'El churn y el tiempo de vida medio' y 'Anualización del churn o tasa de bajas'.

Ahora dibujamos el evolutivo de cartera acumulada mes a mes, representando en diferentes gamas de grises las fracciones de cartera correspondientes a cada cohorte (individuos dados de alta el mismo mes).



Es visible la reducción estacional de actividad comercial en los meses estivales. Con algo más de dificultad se aprecia el efecto de bajas masivas en abril de 2001. Los ataques de Telefónica sin embargo no resultan nada fáciles de detectar en esta evolución mes a mes al encontrarse distribuidos en el tiempo. Es por ello que resulta tan clarificador el estudio de cohortes visto.

Finalizamos con el estudio de cohortes sobre las bajas de una cartera real a lo largo de un histórico de varios años. Pueden verse claramente los patrones horizontales de alto churn (que en ocasiones solo se presentaron en ciertas épocas del evolutivo), así como las diagonales provocadas por "tsunamis" puntuales en el mercado, o quizá estacionalidades, que afectaron a toda la cartera en meses concretos.



2 comentarios:

  1. Explicación muy didáctica y, desde mi punto de vista, emotiva ya que pienso que en esos tiempos se hacían análisis de mucha calidad. Gracias Guillermo. Saludos JMZ

    ResponderEliminar
  2. Gracias a ti por tu comentario JMZ. Precisamente hablaba con mi ex-jefe Pablo estos días sobre este tipo de análisis que hacíamos, y que ni siquiera sabíamos tenían nombre propio.

    ResponderEliminar

Por claridad del blog, por favor trata de utilizar una sintaxis lo más correcta posible y no abusar del uso de emoticonos, mayúsculas y similares.