Taller de minería de datos de Gordon Linoff – Segmentación por Comportamiento

En el 1er Congreso Internacional de CRM de México de 2007 (Noviembre 12 y 13), Gordon Linoff dictó el taller de minería de datos. En Noviembre y Diciembre comenté los temas del taller y la técnica de modelado de Cluster Analysis. En esta ocasión voy a comentar el tema de la segmentación por comportamiento.

Esta segmentación fue explicada utilizando el caso de estudio de un periódico. El periódico en cuestión tiene millones de clientes suscritos y gasta una cantidad considerable en investigaciones de mercado, las cuales consisten en contactar a una muestra de varios miles de clientes a los cuales se les aplica una encuesta y posteriormente se clasifican según su uso actual y tendencia en los siguientes segmentos: en riesgo, en crecimiento, en desarrollo y comprometidos. El orden de los segmentos corresponde al aumento de su “lealtad” hacia el periódico, en donde el segmento en riesgo es el que menos usa el periódico y tiene la tendencia que representa el menor valor y el segmento de los comprometidos son los que más usan el servicio y tienen la mejor tendencia, por lo que se les considera como los más leales.

La segmentación en esas categorías permite identificar a los clientes de valor. Sin embargo, más allá de eso no explica mucho y por lo tanto no hay muchas posibilidades de acción.

Entonces el objetivo se replanteó: hay que identificar los comportamientos de los clientes con la intensión no solo de entenderlos sino de facilitar el determinar acciones para cambiar dicho comportamiento. Y entender el comportamiento de los clientes implica conocer su ciclo de vida y que eventos los caracterizan. Para poder hacer esto, como se explicó en posts anteriores, hay que involucrar a los usuarios del negocio por que son ellos los que pueden identificar los comportamientos significativos y de utilidad para el negocio. También por que son ellos los que tienen un mayor entendimiento de los clientes.

El análisis entonces se enfocó en analizar a los clientes por su comportamiento a lo largo del tiempo, como lo muestra la siguiente figura, en donde se puede ver cuando un cliente inicia consumiendo un servicio P1 (tal vez una suscripción básica), después aumenta sus consumos a P2 (ej. pide algunas revistas complementarias), posteriormente cancela el servicio P2 y mantiene solo su consumo P1 y luego suspende su consumo totalmente. Posteriormente se pueden observar algunos comportamientos un poco diferentes.

Gordon-Behavior1

El análisis consiste entonces en caracterizar el comportamiento de cada uno de los trimestres (etiquetas en negro de arriba). Entonces hay trimestres en donde el comportamiento es el inicio del servicio o New, si no hay cambios se mantiene activo, los aumentos en servicios son Up y las disminuciones en servicio son Down.

Gordon Behavior 2

El análisis del comportamiento toma mucho sentido cuando se analizan sobre el tiempo. Entonces se identifican los siguientes seis comportamientos principales:

Gordon Behavior 3

Posteriormente, para cada cliente del estudio se analiza su comportamiento y se determina a que categoría pertenece, comparándolo con el segmento original. La siguiente figura muestra el caso para algunos clientes.

Gordon Behavior 4

Como puede verse, hasta ahora la parte interesante del proceso ha tenido más que ver con el entendimiento de los clientes y del negocio para poder hacer un planteamiento que tenga sentido. Es muy común ver segmentaciones basadas únicamente en el saldo de los clientes y al final, si bien es un dato importante, por si mismo no da mucha orientación de acciones claras a ejecutar.

Posteriormente se cuantificaron los clientes y se realizaron nuevas categorías basadas en el comportamiento y ahora si con minería de datos se buscaron las reglas que se repetían para cada nuevo segmento, permitiendo redefinirlo. Por ejemplo, algunas reglas que se identificaron para el nuevo segmento Commited (que tienden a permanecer como clientes… esto es Steady, Growing Existing y Declining Current) fueron:

  • Producto actual suscripción diaria, pago con tarjeta de crédito y antigüedad mayor a 6 meses.
  • Producto actual suscripción de y días a la semana, pago con facturación y antigüedad mayor a 1 año.
  • Producto actual suscripción días hábiles y antigüedad de entre 1 y 6 años

Los nuevos segmentos que se generaron con este análisis y con la minería de datos tuvieron ventajas significativas con los segmentos originales:

  • Mayor confiabilidad. Los encuestados no siempre dicen la verdad… o al menos sus respuestas no necesariamente corresponden con su comportamiento.
  • Mayor alcance. La muestra permite tomar decisiones precisas únicamente sobre los clientes encuestados. Sin embargo es difícil la toma de decisiones con precisión para los millones de clientes no encuestados.
  • Facilidad para la toma de decisiones. Los segmentos por comportamiento y las reglas que los definen son más entendibles para la gente de negocio y permiten generar acciones más fáciles ya sea para promover que más clientes cumplan una regla que los convierta en “commited” como para identificar de manera temprana el cambio en un cliente que pudiera ponerlo en riesgo.

La técnica que se utilizó fue la de árboles de decisión, el cual explicaré en el siguiente post.

Por José Corona, Solvis Consulting México

Posts anteriores relacionados:

Taller de minería de datos de Gordon Linoff -Cluster Analysis

Taller de minería de datos de Gordon Linoff – 2a parte

Taller de Minería de Datos de Gordon Linoff – 1er Congreso Internacional CRM México

Anuncios

5 thoughts on “Taller de minería de datos de Gordon Linoff – Segmentación por Comportamiento

  1. Hola! excelente blog… pero me quedé con las ganas de leer el caso del modelo de churn…. de verdad estoy muy interesada, será que puedes postear algo? estoy trabajando con un modelo predictor de churn y quisiera más información.

    Súper agradecida de antemano.

  2. Que tal Alejandro. El valor agregado por lo regular esta en las acciones que puedes llevar a cabo para producir un cambio en el comportamiento de tus clientes. Las acciones generalmente se materializan como campañas las cuales pueden ser sumamente varidas y tienen por lo regular el mejor costo/beneficio cuando inciden de manera oportuna en las variaciones del ciclo de vida de los clientes. Una manera de identificarlo y entenderlo es con estadísticas descriptivas, solo que hay que plantearlas con la visión de agrupar y entender a los clientes primero por su comportamiento comercial y después por los aspectos demográficos. Te sorprenderás con la cantidad de oportunidades que se pueden identificar con análisis bastante sencillos ¿Por donde empezar? Primero que nada con la identificación del cliente para poder agrupar todas las transacciones e interacciones que describen su comportamiento. En tu industría es muy probable que esto se logre solo con un programa de lealtad (si es que no lo tienes). De tal forma que los clientes se identifiquen (con su tarjeta, un token o alguna tecnología novedosa) y puedas concentrar la información transaccional y empezar a entender su ciclo de vida y cuando es posible ejercer acciones sobre el.
    Déjame saber si esta información te es de utilidad
    -José Corona

  3. Actualmente trabajo en investigación de mercados en una emprea de juegos de suerte y azar, además d eotros productos y me gustaría inciarme en el maravilloso mundo del CRM, para hacer investigaciones que vayan más allá d elos simples anáñisis con estad´siticas descritptivas, quiero darle un valor agregadfo mayor a más investigaciones. Por donde puedo inciar????

  4. Muchas Gracias por tu comentario. Me da mucho gusto que te este siendo de utilidad. En breve estaré publicando el sigueinte post, espero que también sea de tu agrado.

    Si en algún momento quieres compartir lo que vayas aprendiendo a lo largo de tu experiencia con la minería de datos, ten presente este medio para compartirlos con la comunidad de CRM que estamos formando.

    Saludos

    -José Ramón Corona

  5. Muy bueno el post. Interesantísimo. En mi caso me estoy iniciando en un sector de Data Mining en la empresa en la que trabajo y toda esta información es de suma utilidad. El ejemplo es sencillo con lo que, para estos fines, viene muy bien.

    Muchas gracias y espero el próximo post.

    Saludos

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s