El clúster Bietápico es una herramienta de exploración diseñada para revelar agrupaciones naturales (o clústeres) dentro de un conjunto de datos que de otro modo no serían evidentes. El algoritmo que emplea este procedimiento incluye varias atractivas características que lo hacen diferente de las técnicas de agrupación en clústeres tradicionales.
- Tratamiento de variables categóricas y continuas. Al suponer que las variables son independientes, es posible aplicar una distribución normal multinomial conjunta en las variables continuas y categóricas.
- Selección automática del número de clústeres. Mediante la comparación de los valores de un criterio de selección del modelo para diferentes soluciones de agrupación en clústeres, el procedimiento puede determinar automáticamente el número óptimo de clústeres.
- Escalabilidad. Mediante la construcción de un árbol de características de clústeres (CF) que resume los registros, el algoritmo bietápico puede analizar archivos de datos de gran tamaño.
Por ejemplo, las empresas minoristas y de productos de consumo aplican habitualmente técnicas para obtener información que describe los hábitos de consumo, el sexo, la edad, el nivel de ingresos y otros atributos de sus clientes. Estas empresas adaptan sus estrategias de marketing y desarrollo de productos a cada grupo de consumidores para aumentar las ventas y el nivel de fidelidad a la marca.