En SPSS Modeler, puede configurar flujos para procesar datos y experimentar con diferentes técnicas de modelado. Mediante el proceso de modelización, se crea un modelo afinado que puede utilizarse para el análisis predictivo.
Flujos de construcción
Un flujo es una serie de nodos que se conectan en el lienzo.
- Flujo
- Un flujo es un grupo de operaciones de tratamiento de datos que se conectan en secuencias. Los flujos representan el flujo de datos a través de cada operación. Los datos fluyen desde la fuente de datos a través de la secuencia de operaciones hasta el final. Normalmente, un flujo termina en un modelo o tipo de salida de datos, como una tabla o un gráfico.
Los flujos se crean añadiendo nodos al lienzo y conectándolos entre sí.
- Lienzo
- El lienzo es el área de trabajo principal en SPSS Modeler, y es donde usted construye sus flujos.
- Nodos
- Un nodo es un conjunto modular y autónomo de operaciones. Los nodos son una forma gráfica de representar estas operaciones, y cada nodo tiene un icono único. Estos nodos pueden enlazarse en el lienzo en un flujo para procesar datos más complejos.
Puede añadir nodos de modelado a su flujo. Cada uno de los nodos de modelado es una técnica de modelado diferente. Puede añadir varios nodos de modelado a su flujo para probar diferentes técnicas de modelado con sus datos. Cuando termine de configurar su flujo, puede ejecutarlo para que los datos sean procesados y analizados por los nodos de modelado.
El proceso de modelización
La capacidad de predecir un resultado es el objetivo central del análisis predictivo, y comprender el proceso de modelado es la clave para utilizar SPSS Modeler.
Un modelo es un conjunto de reglas, fórmulas o ecuaciones que pueden utilizarse para predecir un resultado basándose en un conjunto de campos de entrada o variables de sus datos. Por ejemplo, puede que una institución financiera utilice un modelo para predecir la probabilidad de que los solicitantes de un préstamo sean un riesgo bueno o malo, basándose en información que ya se conoce sobre solicitantes anteriores. Un modelo ajustado es uno de los objetivos de trabajar en SPSS Modeler.
La modelización se lleva a cabo en múltiples iteraciones. Normalmente, es posible que ejecute varios nodos de modelado que utilicen los parámetros predeterminados. A continuación, puede ajustar los parámetros para el nodo de modelado, o puede volver a la fase de preparación de datos para ajustar los datos para el nodo de modelado.
SPSS Modeler ofrece varios métodos de modelado tomados del aprendizaje automático, la inteligencia artificial y la estadística. Puede utilizar los métodos disponibles en la paleta de nodos para obtener nueva información de sus datos y desarrollar modelos predictivos. Cada método tiene ciertos puntos fuertes y es más adecuado para determinados tipos de problemas.
Si obtiene resultados prometedores de uno de estos nodos de modelado, puede guardarlo como modelo. A continuación, este modelo puede promocionarse y desplegarse para su uso en análisis predictivos en tiempo real.
Paleta de nodos
La paleta de nodos tiene todos los nodos disponibles en SPSS Modeler. Se organizan en grupos según su función. Puede añadir cualquier nodo de la paleta de nodos a su flujo.
Para más información sobre la paleta de nodos, véase Paleta de nodos.
SuperNodes
Puede guardar todo o parte de su flujo como un SuperNode. Este SuperNode puede utilizarse como un nodo en otros flujos. Puede utilizar un SuperNode para añadir capas complejas de procesamiento a un flujo sin añadir una larga secuencia de nodos que pueden desordenar su lienzo.
Para más información sobre SuperNodes,, consulte SuperNodes.