Taller de minería de datos de Gordon Linoff – 2a parte

El día de ayer asistí a la segunda parte del taller de Minería de Gordon Linoff: Creación de modelos de minería de datos. En el explicó algunas de las técnicas mas comunes para el entendimiento de los clientes.

En primer lugar hizo énfasis en la importancia de tener un Data Warehouse con suficiente historia para poder hacer un mejor análisis de los clientes. Para algunos tipos de negocio, como el de retail, hay comportamientos importantes que solo pueden observarse en temporadas clave, como en la navideña. Pero si el Data Warehouse tiene solo la historia de algunos meses, podríamos perder patrones altamente importantes (y de alto margen) de los clientes.

Algunos conceptos clave:

  • Entrenamiento – es el proceso de crear un modelo a partir de un conjunto inicial de datos.
  • Calificación (scoring) – Es el proceso de aplicar el modelo a un conjunto de datos nuevo.
  • Minería Dirigida – Busca patrones basados en eventos conocidos. Generalmente el modelado predictivo y de propensión.
  • Minería No Dirigida – Busca patrones en datos sin tener un ejemplo definido para poder entenderlos mejor: Clustering o análisis de agrupación

Pero como en este caso se trata de clientes, también hay que entender y obtener información del cliente. Esto nos obliga a definir primero… que es un cliente, entender las características específicas que los describen, conocer los eventos significativos de su vida (como personas y como clientes), entender su ciclo de vida como cliente y tener claro como se organizan los procesos de negocio alrededor del ciclo de vida, de sus principales eventos y de los datos que los describen. Esto refuerza lo que comentó en la sesión anterior, el negocio tiene que estar involucrado en el análisis.

De lo que me pareció mas importante fue que en la mayoría de los casos que presento, el planteamiento original con que inicio la minería tuvo que ser replanteado. Generalmente esto se debió a que en un inicio se tenía una idea que parecía como la obvia, pero al ir redescubriendo a los clientes a través de sus datos esa idea en realidad no era correcta o no era aplicable. Por ejemplo, en el caso del modelo de churn (deserción de clientes) de un telco, el planteamiento original fue determinar un índice de propensión de churn a todos los clientes. Sin embargo esto creaba una serie de complejidades que en realidad no aportaban mucho al negocio. El planteamiento final fue el siguiente: Para el 24 de cada mes, obtener la lista de los 10,000 clientes elite con mayor probabilidad de desertar durante el mes siguiente.

Gordon explico las técnicas de modelado para los siguientes casos de negocio:

  • Análisis para agrupación (cluster) geográfica para un periódico que quería extender su radio de acción a localidades más pequeñas, incluyendo noticias locales y vendiendo publicidad también local.
  • Segmentación de clientes según su comportamiento, también para un periódico.
  • Predicción de Churn para una empresa de Telecomunicaciones.
  • Determinar la siguiente mejor oferta para los anuncios en Internet de un banco.

Cada uno de los ejemplos fue sumamente interesante y creo que vale la pena comentarlos por separado para poder resaltar sus puntos clave. Por esta razón los voy ir comentando durante los siguientes días.

Por José Corona, Solvis Consulting México
Posts anterior relacionado:

Taller de Minería de Datos de Gordon Linoff – 1er Congreso Internacional CRM México

Anuncios

4 thoughts on “Taller de minería de datos de Gordon Linoff – 2a parte

  1. Muchas gracias por el comentario.
    En el website de Data-Miners, la empresa de Gordon, hay una sección con los libros que ellos han escrito y con los que ellos recomiendan. Este es el link:
    http://www.data-miners.com/bookstore.htm
    Yo no los he leído, pero algunos colegas me recomiendan mucho iniciar con Data Mining Techniques y con su nuevo libro Data Analysis Using SQL and Excel.
    Espero que te sea de utilidad

  2. Se me hace super interesante todo esto. En la compañia que yo trabajo vamos a inicar con todo el proyecto de CRM y creo que la mineria de datos era basica aunque a mi me recomendaron entrar a la de centros de contacto. Les recomendó alguna bibliografia el espositor??? Crees que pueda obtener la presentación???
    Gracias!

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s