Noeuds prenant en charge la fonctionnalité SQL Pushback

Dernière mise à jour : 15 avr. 2025
Optimisation SQL (SPSS Modeler)

Les tableaux suivants présentent les nœuds qui représentent les opérations d'exploration de données prenant en charge le pushback SQL. Si un noeud n'apparaît pas dans ces tableaux, il ne prend pas en charge la fonctionnalité SQL Pushback.

Tableau 1. Noeuds d'opérations sur les lignes
Noeuds prenant en charge la génération SQL Remarques
Sélectionner Prend en charge la génération uniquement si la génération SQL pour l'expression de sélection elle-même est prise en charge. Si des champs ont des valeurs nulles, la génération SQL ne donne pas les mêmes résultats pour la suppression que ceux donnés dans SPSS Modelernatif.
Exemple L'échantillonnage simple prend en charge la génération SQL à des degrés variables en fonction de la base de données.
Agréger La prise en charge de la génération SQL pour l'agrégation dépend du type de stockage des données.
Agréger RFM Prend en charge la génération sauf en cas de sauvegarde de la date de la deuxième et troisième transactions les plus récentes, ou en cas de prise en compte des transactions récentes. Toutefois, cette prise en compte fonctionne si la fonction datetime_date(YEAR,MONTH,DAY) est répercutée.
Trier  
Fusionner Aucun code SQL n'est généré pour la fusion par ordre.

La fusion par clé avec les jointures externe complète ou partielle est seulement prise en charge si la base de données/le pilote la prend en charge. Les champs de saisie qui ne correspondent pas peuvent être renommés à l'aide d'un nœud de filtre ou des paramètres de filtre d'un nœud d'importation.

Prend en charge la génération SQL pour la fusion conditionnelle.

Pour tous les types de fusion, SQL_SP_EXISTS n'est pas pris en charge si les entrées proviennent de bases de données différentes.

Ajouter Prend en charge la génération si les entrées ne sont pas triées. L'optimisation SQL n'est possible que lorsque les entrées possèdent le même nombre de colonnes.
Distinguer Un noeud Distinguer avec le mode par défaut Créer un enregistrement composite pour chaque groupe sélectionné ne prend pas en charge l'optimisation SQL.
Tableau 2. Prise en charge de la génération SQL dans le noeud Echantillonner pour l'échantillonnage simple
Mode Exemple Taille max Valeur de départ Db2 for z/OS Db2 for OS/400 Db2 for Win/UNIX Oracle SQL Server Teradata
Inclure Première valeur n/a   Y Y Y Y Y Y
  Tous les désactivé   Y Y Y Y   Y
    max   Y Y Y Y   Y
  % aléatoire désactivé désactivé Y   Y Y   Y
      activé Y   Y Y    
    max désactivé Y   Y Y   Y
      activé Y   Y Y    
Annuler Première valeur désactivé         Y    
    max         Y    
  Tous les désactivé   Y Y Y Y   Y
    max   Y Y Y Y   Y
  % aléatoire désactivé désactivé Y   Y Y   Y
      activé Y   Y Y    
    max désactivé Y   Y Y   Y
      activé Y   Y Y    
Tableau 3. Prise en charge de la génération SQL dans le noeud Agréger
Stockage Somme Moyenne Min Maxi Ecart type Médiane Nombre Ecart Percentile
Entier Y Y Y Y Y O* Y Y O*
Réel Y Y Y Y Y O* Y Y O*
Date :     Y Y   O* Y   O*
Durée     Y Y   O* Y   O*
Horodatage     Y Y   O* Y   O*
Chaîne     Y Y   O* Y   O*

* La médiane et le percentile sont pris en charge sur Oracle.

Tableau 4. noeuds d'opérations sur les champs
Noeuds prenant en charge la génération SQL Remarques
Type La génération SQL n'est prise en charge que si le nœud Type est instancié et qu'aucune vérification de type ABORT ou WARN n'est spécifiée.
Filtrer  
Calculer

La génération SQL n'est prise en charge que si le code SQL généré à partir de l'expression dérivée est valide.

Cependant, SPSS Modeler ne peut pas générer SQL si vous choisissez State ou Count pour l'option Derive as.

  • STATE ne peut pas être traduit en SQL car il dépend d'un suivi d'état persistant, que SQL ne gère pas de manière inhérente.
  • COUNT nécessite le maintien d'un total courant, ce que le langage SQL standard ne permet pas non plus.
Ensemble Prend en charge la génération SQL pour les cibles continues. Pour les autres champs cible, prend uniquement en charge la génération si la méthode d'ensemble La plus grande confiance gagne est utilisée.
Remplacer La génération SQL est prise en charge si le code SQL généré à partir de l'expression dérivée est valide.
Anonymiser Prend en charge la génération SQL pour les cibles continues, et une génération SQL partielle pour les cibles nominales et indicateurs.
Recoder  
Regroupement par casiers La génération SQL est prise en charge si la méthode de regroupement des tuiles (nombre égal) est utilisée et si l'option Lire à partir de l'onglet Valeurs de regroupement si disponible est sélectionnée. En raison des différences dans le mode de calcul des limites de casiers (du fait de la nature de la répartition des données dans les champs de casier), vous pouvez constater des écarts dans la sortie du regroupement par casiers lorsque vous comparez l'exécution de flux normale avec les résultats de SQL Pushback. Pour éviter ceci, utilisez la méthode de création de quantiles Nombre d'enregistrements et les quantiles Ajouter au suivant ou Conserver dans l'élément actuel pour obtenir la correspondance la plus proche entre les deux méthodes d'exécution de flux.
Analyse RFM La génération SQL est prise en charge si l'option Lire à partir de l'onglet Valeurs de l'emplacement si disponible est sélectionnée, mais les nœuds en aval ne la prendront pas en charge.
Partition Prend en charge la génération SQL pour affecter des enregistrements aux partitions.
Binariser  
Restructurer  
Tableau 5. Noeuds de graphiques
Noeuds prenant en charge la génération SQL Remarques
Distribution  
Web  
Evaluation  

Pour certains modèles, il est possible de générer une instruction SQL pour le nugget de modèle, en répercutant l'étape de scoring de modèle dans la base de données. L'utilisation principale de cette caractéristique n'est pas d'améliorer les performances, mais d'autoriser des flux contenant ces nuggets à voir l'intégralité de leur instruction SQL répercutée. Pour plus d'informations, voir Générer du code SQL à partir de nuggets de modèle.

Tableau 6. nuggets de modèle
Nuggets de modèle prenant en charge la génération SQL Remarques
Arbre C&RT Prend en charge la génération SQL pour l'option d'arbre unique, mais pas pour les options de boosting, de bagging ou de jeux de données volumineux.
QUEST  
CHAID  
C5.0  
Liste de décision  
Linéaire Prend en charge la génération SQL pour l'option de modèle standard, mais pas pour les options de boosting, de bagging ou de jeux de données volumineux.
Réseau de neurones Prend en charge la génération SQL pour l'option de modèle standard (Multilayer Perceptron uniquement), mais pas pour les options de boosting, de bagging ou de jeux de données volumineux.
ACP/Facteur  
Logistique Prend en charge la génération SQL pour la procédure multinomiale, mais pas la procédure binomiale. Pour la procédure multinomiale, la génération n'est pas prise en charge lorsque les confiances sont sélectionnées, sauf si le type de cible est Indicateur.
Jeu de règles généré  
Classificateur automatique Si un adaptateur de scoring de type Fonction définie par l'utilisateur (UDF) est activé, ces nuggets prennent en charge la fonctionnalité SQL Pushback. En outre, si la Génération SQL pour les cibles continues ou la méthode d'ensemble La confiance la plus élevée l'emporte est utilisée, ces nuggets prennent en charge plus de répercussions en aval.
Numérisation automatique
Tableau 7. Noeuds de sorties
Noeuds prenant en charge la génération SQL Remarques
Tableau Prend en charge la génération si la génération SQL est prise en charge pour l'expression de mise en évidence.
Matrice Prend en charge la génération sauf si la fonction Toutes les valeurs numériques est sélectionnée pour l'option Champs.
Analyse La prise en charge de la génération dépend des options sélectionnées.
Transformer  
Statistiques Prend en charge la génération si l'option Corréler n'est pas utilisée.
Rapport  
Valeurs globales