0 / 0
Volver a la versión inglesa de la documentación
Nodo Secuencia
Última actualización: 22 nov 2024
Nodo Secuencia (SPSS Modeler)

El nodo Secuencia descubre patrones en datos secuenciales u orientados al tiempo, en el formato bread -> cheese. Los elementos de una secuencia son conjuntos de elementos que constituyen una única transacción.

Por ejemplo, si una persona va a la tienda y compra pan y leche y, varios días después, vuelve a la tienda para comprar un poco de queso, la actividad de compras de esa persona se puede representar como dos conjuntos de elementos. El primer conjunto de elementos contiene pan y leche y el segundo contiene queso. Una secuencia es una lista de conjuntos de elementos que tiende a producirse en un orden previsible. El nodo Secuencia detecta secuencias frecuentes y crea un nodo de modelo generado que se puede utilizar para realizar predicciones.

Requisitos. Para crear un conjunto de reglas del nodo Secuencia, es necesario especificar un campo de ID, un campo de tiempo opcional y uno o varios campos de contenido. Observe que estos ajustes se deben realizar en el separador Campos del nodo de modelado; no se pueden leer en el nodo Tipo anterior de la ruta. El campo de ID puede tener cualquier rol o nivel de medición. Si se especifica un campo de tiempo, éste puede tener cualquier rol, aunque su almacenamiento debe ser numérico, una fecha, una hora o una marca de tiempo. Si no se especifica un campo de tiempo, el nodo Secuencia utilizará una marca de tiempo implícita que se activará utilizando los números de fila como valores de tiempo. Los campos de contenido pueden tener cualquier nivel de medición y rol, pero todos los campos de contenido deben ser del mismo tipo. Si son numéricos, deben ser rangos enteros (no rangos reales).

Puntos fuertes. El nodo Secuencia se basa en el algoritmo de reglas de asociación de CARMA, que utiliza un método de dos pasos para encontrar las secuencias. Además, el nodo de modelo generado que ha creado el nodo Secuencia se puede insertar en una ruta de datos con el fin de crear predicciones. El nodo de modelo generado también puede generar supernodos para detectar y contar las secuencias específicas y realizar predicciones basadas en secuencias específicas.