0 / 0
Torna alla versione inglese della documentazione
Opzioni di memorizzazione nella cache dei nodi
Ultimo aggiornamento: 07 giu 2024
Opzioni di memorizzazione nella cache per i nodi (SPSS Modeler)

Per ottimizzare l'esecuzione dei flussi, è possibile impostare una cache in qualsiasi nodo diverso da un nodo terminale. Quando si imposta una cache su un nodo, la cache viene riempita con i dati che passano attraverso il nodo alla successiva esecuzione del flusso di dati. Da quel momento in poi, i dati vengono letti dalla cache (che viene archiviata temporaneamente) invece che dall'origine dati.

La memorizzazione dei dati nella cache è utile soprattutto dopo un'operazione che richiede tempo, per esempio un ordinamento, un'unione o un'aggregazione. Si supponga, per esempio, che esista un nodo di importazione impostato in modo da leggere i dati relativi alle vendite da un database e un nodo Aggregazione che riepiloga le vendite in base alla posizione. È possibile impostare una cache nel nodo Aggregazione anziché nel nodo di importazione, in modo tale da memorizzarvi i dati aggregati anziché l'intero dataset.
Nota: la memorizzazione nella cache dei nodi di importazione, che memorizza semplicemente una copia dei dati originali quando vengono letti in SPSS Modeler, non migliorerà le prestazioni nella maggior parte dei casi.

I nodi con la memorizzazione nella cache abilitata vengono visualizzati con una speciale icona a forma di barra retroversa. Quando i dati vengono memorizzati nella cache del nodo, l'icona cambia in un segno di spunta.

Figura 1. Confronto tra nodo con cache vuota e nodo con cache piena
Mostra un nodo con una cache vuota e un nodo con una cache completa

Per abilitare una cache

Passare con il mouse sul nodo nel flusso, quindi fare clic sul menu di overflow e selezionare Cache > Abilita.

È possibile disattivare la cache in qualsiasi momento disabilitandola.

Memorizzazione in cache dei nodi in un database

Per i flussi eseguiti in un database, i dati possono essere memorizzati nella cache mid-stream in una tabella temporanea nel database invece che nel file system. Insieme all'ottimizzazione SQL, ciò consente di ottenere significativi vantaggi in termini di prestazioni. Ad esempio, l'output da un flusso che unisce più tabelle per creare una vista di data mining può essere memorizzato in cache e riutilizzato poi in base alle esigenze. Generando automaticamente codice SQL per tutti i nodi downstream, è possibile migliorare ulteriormente le prestazioni.

Per sfruttare la memorizzazione nella cache del database, è necessario che siano attivate l'ottimizzazione SQL e la memorizzazione nella cache del database.

Con la memorizzazione nella cache del database abilitata, è possibile memorizzare i dati in qualsiasi nodo non terminale e la cache verrà creata automaticamente direttamente nel database alla successiva esecuzione del flusso. Se la memorizzazione nella cache del database o l'ottimizzazione SQL non sono attivate, la cache verrà scritta nel file system.

Nota: i seguenti database supportano le tabelle temporanee per la memorizzazione nella cache: Db2, Oracle, SQL Servere Teradata. Altri database, come Netezza, utilizzeranno una tabella normale per la memorizzazione nella cache del database.

Per svuotare una cache

Un'icona a forma di barra retroversa per nodo indica che la cache è vuota. Quando la cache è piena, l'icona cambia in un segno di spunta. Per sostituire il contenuto della cache, è necessario innanzitutto svuotare la cache e poi rieseguire il flusso di dati per riempirla di nuovo.

Passare con il mouse sul nodo nel flusso, quindi fare clic sul menu di overflow e selezionare Cache > Svuota.

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni