Taller de Minería de Datos de Gordon Linoff – 1er Congreso Internacional CRM México

Hoy asistí al taller de Minería de Datos de Gordon Linoff: Diseño y minería de las bases de datos en un modelo de CRM.

El taller tiene dos módulos. En el día de hoy, el módulo fue el “Proceso de la minería de datos”. En el Gordon se enfocó en dar un panorama general de lo que es la minería de datos en el contexto del CRM. El primer paso fue una definición de minería: Explorar y analizar grandes cantidades de datos con el fin de descubrir patrones y reglas que sean significativas.

Como primer punto señalo el origen de los datos y la complejidad para obtener significado de grandes depósitos que semejan basureros de datos hasta las peculiaridades de los datos según su sistema de procedencia (transaccional, datawerehouse, datamart, etc.).Buna parte de la minería de datos tiene que ver con las consideraciones para interpretar información con diferentes características y sobre todo, manejar con cuidado datos “sucios”, datos normalizados y desnormalizados.

Un punto muy importante es la participación de los usuarios de los datos, esto es, las personas que pueden entender desde el punto de vista del negocio los datos base para el análisis. Por un lado son los que pueden explicar diversas “peculiaridades” de la información para tener interpretaciones correctas (ejemplo, clientes nuevos que tienen pocos registros). Pero también permiten orientar la búsqueda de comportamientos que tengan valor para el negocio, como es el caso de los comportamientos que preceden un evento significativo, como la cancelación de un servicio.

Para poder tener una idea mejor de las capacidades de la minería de datos, Gordon presentó tres casos de estudio: uno de empresas de telecomunicaciones y dos de retail, el primero sin programa de lealtad y el segundo con programa de lealtad que le permite identificar a cada uno de sus clientes.

En cada caso explicó como se fueron identificando relaciones existentes en la información, sin embargo, por medio de gráficas y mapas, se fueron discriminando aquellas que tenían un potencial de negocio sumamente claro de las que no agregaban valor, como la identificación prospectos para servicios de ISP o la propensión de compra de productos en localidades con alta población hispana en Texas.

Existen otras formas para entender a los clientes, como es el caso de las encuestas o de los estudios de mercado, sin embargo, como en el caso de los detectives forenses de la famosa serie de televisión CSI… los clientes pueden mentir (en una encuesta), pero la evidencia (los datos) no. Esto es: un cliente puede decir que si esta interesado en un producto… pero no lo compra.

Alguien pregunto:¿Cuándo debemos pensar en minería de datos y cuando en herramientas de análisis tipo OLAP? Gordon explica que en los casos en donde sabemos que existe una relación, las herramientas OLAP nos permite entender mejor sus características y variantes. En aquellos casos en donde no sabemos que relaciones existen… la minería de datos es la opción para descubrirlas o… desenterrarlas.

Sin embargo hay que ser cuidadosos, la definición de minería a manera de broma que contó Gordon resume el riesgo: “La minería de datos consiste en torturar a los datos hasta que confiesen… si los torturas lo suficiente ellos confesaran cualquier cosa.”.

Gordon hablará mañana de las técnicas de modelación de datos mas utilizadas.

Por José Corona, Solvis Consulting México.

Anuncios

8 thoughts on “Taller de Minería de Datos de Gordon Linoff – 1er Congreso Internacional CRM México

  1. El Congreso de CRM se realizará en el Centro de Exposiciones WTC de la Cd. de México los días 17 y 18 de noviembre.

    Aun no tenemos el programa pero estamos trabajando en el él, de hecho si tienes interés en algún tema en especifico te agradeceremos nos lo digas.

  2. Es muy importante tener claro el poder de un estudio de opinion basado en encuestas y contrastarlo contra el poder de la minería de datos. Mi amigo consultor de Datos y Cifras del Noroeste, S. C., define la encuesta como una fotografía (instantánea) y es útil a corto plazo, es muy útil pero puede ser muy costosa repetirla o darle tracking…La minería de datos facilita ese tracking desde los origenes del negocio, o más bien desde los registros de los datos.

    También coincido que la tortura (de datos) pueden llevarnos a las sobre-explotacion.
    A propòstio, Data Mining significa explotación de datos.

    Me interesan sus blogs

  3. Marcelo, muchas gracias por tu comentario. Me parece muy interesante lo que comentas y con mucho gusto visitaré tu blog.

    Estamos en contacto.

    Saludos

    -José Corona

  4. Muy interesante José, y estoy completamente de acuerdo con el comentario de Gordon respecto de tener cuidado cuando se torturan demasiado los datos porque podrían confesar cualquier cosa. La teoría de la Información nos ofrece una alternativa a la tortura que evita el sobrentrenamiento y posibilita enormes ventajas.

    Te invito a visitar my blog en donde hablo acerca de Data Mining con un enfoque en la Teoría de la Información como solución a muchos problemas que aparecen normalmente.

    http://www.powerhousedm.blogspot.com

    Gracias y saludos,

    Marcelo

  5. Muchas gracias. Hoy comento la segunda parte del taller, espero que tambien sea de tu agrado. Creo que la visita de Gordon a México ha sido muy provechosa y vale la pena comentarla, ha estado en Universidades (ITAM y Anahuac), en el evento de CRM y hoy esta en el evento de usuarios de SAS como keynote speaker. Saludos

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s