Volver a la versión inglesa de la documentación¿Cómo funciona la retrotracción de SQL?
Optimización de SQL (SPSS Modeler)
Última actualización: 07 oct 2024
Los fragmentos iniciales de un flujo procedente de los nodos de importación de datos son los objetivos principales de la generación de SQL. Cuando se encuentra un nodo que no se puede compilar en SQL, los datos se extraen de la base de datos y se realiza el proceso posterior.
Durante la preparación del flujo y antes de su ejecución, el proceso de generación de SQL se realiza tal como se indica a continuación:
- El software reordena los flujos para mover nodos posteriores en la ruta a la "zona de SQL" donde sea seguro realizar esta operación.
- Si trabaja desde los nodos de importación hacia los nodos terminales, las expresiones SQL se construyen de forma incremental. Esta fase se detiene cuando se detecta que un nodo no se puede convertir a SQL o cuando el nodo terminal (por ejemplo, un nodo Tabla o un nodo Gráfico) se convierte a SQL. Al final de esta fase, cada nodo se etiqueta con una sentencia SQL si el nodo y sus predecesores tienen un equivalente SQL.
- Si trabaja desde los nodos con los equivalentes de SQL más complejos hacia los nodos de importación, se comprueba la validez de SQL. A continuación se elige el SQL validado correctamente para su ejecución.
- Los nodos para los que todas las operaciones han generado SQL se resaltan con un icono SQL junto al nodo en el lienzo de flujo. En función de los resultados, es posible que desee reorganizar el flujo como considere necesario para aprovechar al máximo la ejecución de la base de datos.
¿Dónde se producen las mejoras?
La retrotracción de SQL mejora el rendimiento en determinadas operaciones de datos:
- Uniones (fusionar por clave). Las operaciones de unión pueden aumentar la optimización de las bases de datos.
- Agregación. Los nodos Agregar, Distribución y Web utilizan la agregación para generar los resultados. Los datos resumidos utilizan un ancho de banda considerablemente menor al de los datos originales.
- Selección. La selección de registros en función de ciertos criterios reduce la cantidad de registros.
- Ordenación. La ordenación de los registros es una actividad que requiere un uso intensivo de recursos y que se realiza de una forma más eficaz en una base de datos.
- Derivación de campos. Se generan campos nuevos de una forma más eficaz en una base de datos.
- Proyección de campos. El software solo extrae los campos necesarios para el siguiente proceso de la base de datos, lo que minimiza los requisitos de memoria y de ancho de banda. Lo mismo se aplica a los campos superfluos de los archivos planos: aunque el software debe leer los datos superfluos, no les asigna almacenamiento.
- Puntuación. SQL puede generarse desde árboles de decisión, conjuntos de reglas, regresión linear y modelos generados por factores.