En este blog se exploran las posibilidades de analizar datos y crear modelos basados en la Teoría de la Información usando Powerhouse

miércoles, 10 de octubre de 2007

Powerhouse, una manera diferente de hacer Data Mining

Powerhouse es una herramienta de Data Mining basada en un enfoque completamente distinto que el usado normalmente para analizar datos.

Cuando se intenta realizar un modelo de predicción, generalmente se asume que los datos contienen la información suficiente para lograr un buen modelo.

Powerhouse no supone que existe información, la mide.

Claude Shannon detalló en su Teoría de la Información cómo es posible medir la información en bits usando un concepto llamado entropía.

Powerhouse sienta sus bases en la Teoría de la Información y logra mejorar la práctica de hacer Data Mining mediante las siguientes ventajas que le otorga este enfoque:
  • Los datos son preparados automáticamente a fin de exponer al máximo la información que puedan contener
  • La selección de variables es un proceso directo, rápido y que garantiza un grupo óptimo de variables con información libre de ruido
  • Crea modelos de predicción simples de entender y con rendimientos similares a las redes neuronales
  • Descubre modelos de segmentación que exponen clusters naturales en los datos
El sitio web de Powerhouse contiene información más detallada sobre sus características y ventajas.

No hay comentarios: