0 / 0
Retourner à la version anglaise de la documentation
Comment la fonctionnalité SQL Pushback fonctionne-t-elle ?
Dernière mise à jour : 07 oct. 2024
Optimisation SQL (SPSS Modeler)

Les fragments initiaux d'un flux à partir des noeuds d'importation de données sont les cibles principales pour la génération SQL. Si un noeud ne peut pas faire l'objet d'une compilation en code SQL, les données sont extraites de la base de données et un traitement consécutif est exécuté.

Le processus de génération SQL, qui a lieu pendant la préparation du flux et avant l'exécution, se déroule comme suit :

  • Le logiciel réorganise les flux afin de déplacer les noeuds en aval dans la "zone SQL", s'il est admis que cette action est sûre.
  • Dans le sens noeuds d'importation vers noeuds terminaux, les expressions SQL sont construites de manière incrémentielle. Cette phase s'interrompt lorsqu'elle rencontre un noeud qui ne peut pas faire l'objet d'une conversion SQL ou lorsque le noeud terminal (noeud Table, noeud Graphique, etc.) est converti en code SQL. A la fin de cette phase, chaque noeud comporte une instruction SQL si le noeud et ses prédécesseurs sont dotés d'un équivalent SQL.
  • Dans le sens noeuds dotés des équivalents SQL les plus complexes vers noeuds d'importation, l'instruction SQL fait l'objet d'une vérification de validité. L'instruction SQL validée est choisie pour l'exécution.
  • Les noeuds pour lesquels toutes les opérations ont généré du SQL sont mis en évidence avec une icône SQL en regard du noeud dans l'espace de travail de flux. Sur la base des résultats, vous pouvez réorganiser davantage le flux, si nécessaire, pour bénéficier pleinement de l'exécution de la base de données.

Où les améliorations sont-elles apportées ?

La fonctionnalité SQL Pushback améliore les performances au niveau de plusieurs opérations de données :

  • Jointures (fusion par clés). Les opérations de jointure peuvent accroître l'optimisation au sein des bases de données.
  • Agrégation. Les noeuds Agréger, Proportion et Relations utilisent tous l'agrégation pour produire leurs résultats. Les données récapitulatives utilisent beaucoup moins de bande passante que les données d'origine.
  • Sélection : La sélection d'enregistrements sur la base de critères spécifiques réduit le nombre d'enregistrements.
  • Tri. Le tri des enregistrements est une activité très consommatrice de ressources qui est exécutée plus efficacement dans une base de données.
  • Calcul de champ. Les nouveaux champs sont générés de façon plus efficace dans une base de données.
  • Projection de champ. Le logiciel extrait uniquement, de la base de données, les champs nécessaires aux traitements suivants ; les exigences en termes de bande passante et de mémoire sont ainsi réduites. Idem pour les champs superflus des fichiers plats : même si le serveur doit lire ces champs, il ne leur affecte pas d'espace de stockage.
  • Scoring. Le code SQL peut être généré à partir de modèles d'arbre de décisions, d'ensembles de règles, de régression linéaire et des modèles factoriels générés.
Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus