0 / 0
Volver a la versión inglesa de la documentación
Opciones de almacenamiento en memoria caché para nodos
Última actualización: 07 jun 2024
Opciones de almacenamiento en memoria caché para nodos (SPSS Modeler)

Para optimizar la ejecución de flujos, puede configurar una memoria caché en cualquier nodo que no sea de terminal. Cuando se configura una memoria caché en un nodo, esta se rellena con los datos que pasan a través del nodo la siguiente vez que se ejecuta el flujo de datos. En adelante, los datos se leen desde la memoria caché (que se almacena temporalmente) en lugar de leerse del origen de datos.

El almacenamiento en caché es más útil tras una operación que exige mucho tiempo de ejecución, como la ordenación, fusión o agregación. Por ejemplo, supongamos que tiene un nodo de importación configurado para leer los datos de ventas desde una base de datos y un nodo Agregar que resume las ventas por ubicación. Se puede configurar una memoria caché en el nodo Agregar en lugar de hacerlo en el nodo de importación, ya que se pretende que la memoria caché almacene los datos agregados, no todo el conjunto de datos.
Nota: El almacenamiento en memoria caché en los nodos de importación, que simplemente almacena una copia de los datos originales cuando se leen en SPSS Modeler, no mejorará el rendimiento en la mayoría de las circunstancias.

Los nodos con el almacenamiento en memoria caché habilitado se visualizan con un icono de barra inclinada invertida de círculo especial. Cuando los datos se almacenan en memoria caché en el nodo, el icono cambia a una marca de selección.

Figura 1. Nodo con memoria caché vacía frente a nodo con memoria caché llena
Muestra un nodo con una memoria caché vacía y un nodo con una memoria caché llena

Para habilitar una memoria caché

Pase el cursor por encima del nodo del flujo y, a continuación, pulse el menú de desbordamiento y seleccione Caché > Habilitar.

Puede desactivar la memoria caché en cualquier momento inhabilitándola.

Almacenamiento en memoria caché de nodos en una base de datos

En el caso de los flujos que se ejecutan en una base de datos, puede colocar en memoria caché el flujo intermedio de datos en una tabla temporal en la base de datos en lugar de hacerlo en el sistema de archivos. Al combinarlo con la optimización de SQL, se puede mejorar considerablemente el rendimiento. Por ejemplo, el resultado de un flujo que fusiona varias tablas para crear una vista de minería de datos se puede guardar en caché y reutilizar cuando sea necesario. Al generar automáticamente SQL para todos los nodos posteriores en la ruta, el rendimiento se puede mejorar mucho más.

Para aprovechar el almacenamiento en caché en una base de datos, se debe activar el almacenamiento en caché de la base de datos y la optimización de SQL.

Con el almacenamiento en memoria caché de base de datos habilitado, puede almacenar datos en memoria caché en cualquier nodo no terminal, y la memoria caché se creará automáticamente directamente en la base de datos la próxima vez que se ejecute el flujo. Si no se activa el almacenamiento en caché de la base de datos o la optimización de SQL, la caché se escribirá en el sistema de archivos en lugar de en la base de datos.

Nota: Las bases de datos siguientes dan soporte a tablas temporales con el fin de almacenar en memoria caché: Db2, Oracle, SQL Servery Teradata. Otras bases de datos como, por ejemplo, Netezza, utilizarán una tabla normal para el almacenamiento en memoria caché de base de datos.

Para vaciar una memoria caché

Un icono de barra inclinada invertida de círculo por nodo indica que su memoria caché está vacía. Cuando la caché está llena, el icono cambia a una marca de selección. Si desea reemplazar el contenido de la caché, debe vaciar la caché en primer lugar y, después, volver a ejecutar el flujo de datos para rellenarlo.

Pase el cursor por encima del nodo del flujo y, a continuación, pulse el menú de desbordamiento y seleccione Caché > Vaciar.

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información