0 / 0
Retourner à la version anglaise de la documentation
Options de mise en cache des noeuds
Dernière mise à jour : 07 juin 2024
Options de mise en cache des noeuds (SPSS Modeler)

Pour optimiser l'exécution des flux, vous pouvez configurer un cache sur n'importe quel noeud non terminal. Lorsque vous définissez un cache sur un noeud, le cache est alimenté par les données passant par le noeud lors de l'exécution suivante du flux de données. A partir de là, les données sont lues à partir du cache (qui est stocké temporairement) et non à partir de la source de données.

La mise en cache est plus utile après une opération de longue durée telle que le tri, la fusion ou l'agrégation. Par exemple, supposez que vous disposiez d'un noeud d'importation défini pour la lecture des données relatives aux ventes à partir de la base de données et d'un noeud Agréger qui fournit des résultats de ventes par zone géographique. Vous pouvez définir un cache sur le noeud Agréger plutôt que sur le noeud d'importation pour que le cache stocke uniquement les données agrégées et non l'ensemble de données intégral.
Remarque: La mise en cache des noeuds d'importation, qui stocke simplement une copie des données d'origine telle qu'elle est lue dans SPSS Modeler, n'améliore pas les performances dans la plupart des cas.

Les noeuds pour lesquels la mise en cache est activée sont affichés avec une icône de barre oblique inversée de cercle spéciale. Lorsque les données sont mises en cache sur le noeud, l'icône change et représente une coche.

Figure 1 : Noeud avec cache vide et noeud avec cache plein
Affiche un noeud avec un cache vide et un noeud avec un cache plein

Pour activer un cache

Survolez le noeud dans votre flux, puis cliquez sur le menu déroulant dynamique et sélectionnez Cache > Activer.

Vous pouvez désactiver le cache à tout moment en le désactivant.

Mise en cache de noeuds dans une base de données

Pour les flux qui s'exécutent dans une base de données, vous pouvez mettre en cache les données intermédiaires vers une table temporaire dans la base de données plutôt que dans le système de fichiers. Combinées avec l'optimisation SQL, cela peut entraîner des gains significatifs de performance. Par exemple, la sortie d'un flux qui fusionne plusieurs tables pour créer une vue d'exploration de données peut être mise en cache et réutilisée si nécessaire. La génération automatique du code SQL pour tous les noeuds en aval peut améliorer encore les performances.

Pour tirer profit de la mise en mémoire cache de base de données, vous devez activer les fonctions d'optimisation SQL et de mise en mémoire cache de base de données.

Lorsque la mise en cache de la base de données est activée, vous pouvez mettre en cache les données sur n'importe quel noeud non terminal et le cache sera créé automatiquement directement dans la base de données lors de la prochaine exécution du flux. Si la mise en cache de la base de données ou l'optimisation SQL n'est pas activée, le cache sera alors écrit dans le système de fichiers.

Remarque: Les bases de données suivantes prennent en charge les tables temporaires à des fins de mise en cache: Db2, Oracle, SQL Serveret Teradata. D'autres bases de données, comme Netezza, utilisent une table standard pour la mise en mémoire cache de base de données.

Pour vider un cache

Une icône de barre oblique inversée de cercle par noeud indique que son cache est vide. Lorsque le cache est plein, l'icône change et devient une coche. Pour remplacer le contenu du cache, vous devez au préalable vider le cache, puis réexécuter le flux de données de façon à le remplir de nouveau.

Survolez le noeud dans votre flux, puis cliquez sur le menu déroulant dynamique et sélectionnez Cache > Flush.

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus