0 / 0
Retourner à la version anglaise de la documentation
Noeuds prenant en charge la fonctionnalité SQL Pushback
Dernière mise à jour : 04 oct. 2024
Optimisation SQL (SPSS Modeler)

Les tableaux de cette section contiennent des noeuds qui représentent des opérations d'exploration de données prenant en charge la fonctionnalité SQL Pushback. Si un noeud n'apparaît pas dans ces tableaux, il ne prend pas en charge la fonctionnalité SQL Pushback.

Tableau 1. Noeuds d'opérations sur les lignes
Noeuds prenant en charge la génération SQL Remarques
Sélectionner Prend en charge la génération uniquement si la génération SQL pour l'expression de sélection elle-même est prise en charge. Si des champs ont des valeurs nulles, la génération SQL ne donne pas les mêmes résultats pour la suppression que ceux donnés dans SPSS Modelernatif.
Exemple L'échantillonnage simple prend en charge la génération SQL à des degrés variables en fonction de la base de données.
Agréger La prise en charge de la génération SQL pour l'agrégation dépend du type de stockage des données.
Agréger RFM Prend en charge la génération sauf en cas de sauvegarde de la date de la deuxième et troisième transactions les plus récentes, ou en cas de prise en compte des transactions récentes. Toutefois, cette prise en compte fonctionne si la fonction datetime_date(YEAR,MONTH,DAY) est répercutée.
Trier  
Fusionner Aucun code SQL n'est généré pour la fusion par ordre.

La fusion par clé avec les jointures externe complète ou partielle est seulement prise en charge si la base de données/le pilote la prend en charge. Vous pouvez renommer les champs d'entrées qui ne correspondent pas à l'aide du noeud Filtre ou des paramètres Filtre d'un noeud d'importation.

Prend en charge la génération SQL pour la fusion conditionnelle.

Pour tous les types de fusion, SQL_SP_EXISTS n'est pas pris en charge si les entrées proviennent de bases de données différentes.

Ajouter Prend en charge la génération si les entrées ne sont pas triées. L'optimisation SQL n'est possible que lorsque les entrées possèdent le même nombre de colonnes.
Distinguer Un noeud Distinguer avec le mode par défaut Créer un enregistrement composite pour chaque groupe sélectionné ne prend pas en charge l'optimisation SQL.
Tableau 2. Prise en charge de la génération SQL dans le noeud Echantillonner pour l'échantillonnage simple
Mode Exemple Taille max Graine Db2 for z/OS Db2 pour OS/400 Db2 pour Win/UNIX Oracle SQL Server Teradata
Inclure Premier non disponible   Y Y Y Y Y Y
  Tous les désactivé   Y Y Y Y   Y
    maximal   Y Y Y Y   Y
  % aléatoire désactivé désactivé Y   Y Y   Y
      activé Y   Y Y    
    maximal désactivé Y   Y Y   Y
      activé Y   Y Y    
Annuler Premier désactivé         Y    
    maximal         Y    
  Tous les désactivé   Y Y Y Y   Y
    maximal   Y Y Y Y   Y
  % aléatoire désactivé désactivé Y   Y Y   Y
      activé Y   Y Y    
    maximal désactivé Y   Y Y   Y
      activé Y   Y Y    
Tableau 3. Prise en charge de la génération SQL dans le noeud Agréger
Stockage Somme Moyenne Min. Maxi Ecart type Médiane Nombre Ecart Centile
Entier Y Y Y Y Y O* Y Y O*
Réal Y Y Y Y Y O* Y Y O*
Date :     Y Y   O* Y   O*
Durée     Y Y   O* Y   O*
Horodatage     Y Y   O* Y   O*
Chaîne     Y Y   O* Y   O*

* La médiane et le percentile sont pris en charge sur Oracle.

Tableau 4. noeuds d'opérations sur les champs
Noeuds prenant en charge la génération SQL Remarques
Type Ce noeud prend en charge la génération SQL si le noeud Typer est instancié, et qu'aucune vérification de type ABORT ou WARN n'est indiquée.
Filtrer  
Dériver Prend en charge la génération SQL si le code SQL généré pour l'expression dérivée est pris en charge (voir les expressions plus loin sur cette page).
Ensemble Prend en charge la génération SQL pour les cibles continues. Pour les autres champs cible, prend uniquement en charge la génération si la méthode d'ensemble La plus grande confiance gagne est utilisée.
Enregistrement de non concordance Prend en charge la génération SQL si le code SQL généré pour l'expression dérivée est pris en charge.
Anonymiser Prend en charge la génération SQL pour les cibles continues, et une génération SQL partielle pour les cibles nominales et indicateurs.
Recoder  
Regroupement par casiers Prend en charge la génération SQL si la méthode de regroupement par casiers de type Quantiles (nombres égaux) est utilisée et que l'option Lire à partir de l'onglet Valeurs de casier si disponible est sélectionnée. En raison des différences dans le mode de calcul des limites de casiers (du fait de la nature de la répartition des données dans les champs de casier), vous pouvez constater des écarts dans la sortie du regroupement par casiers lorsque vous comparez l'exécution de flux normale avec les résultats de SQL Pushback. Pour éviter ceci, utilisez la méthode de création de quantiles Nombre d'enregistrements et les quantiles Ajouter au suivant ou Conserver dans l'élément actuel pour obtenir la correspondance la plus proche entre les deux méthodes d'exécution de flux.
Analyse RFM Prend en charge la génération SQL si l'option Lire dans l'onglet Valeurs d'intervalle si disponible est sélectionnée mais les noeuds en aval ne prennent pas en charge la génération SQL.
Partitionner Prend en charge la génération SQL pour affecter des enregistrements aux partitions.
Binariser  
Restructurer  
Tableau 5. Noeuds de graphiques
Noeuds prenant en charge la génération SQL Remarques
Distribution  
Toile d'araignée mondiale  
Évaluation  

Pour certains modèles, il est possible de générer une instruction SQL pour le nugget de modèle, en répercutant l'étape de scoring de modèle dans la base de données. L'utilisation principale de cette caractéristique n'est pas d'améliorer les performances, mais d'autoriser des flux contenant ces nuggets à voir l'intégralité de leur instruction SQL répercutée. Pour plus d'informations, voir Génération de SQL à partir de nuggets de modèle .

Tableau 6. nuggets de modèle
Nuggets de modèle prenant en charge la génération SQL Remarques
Arbre C&RT Prend en charge la génération SQL pour l'option d'arbre unique, mais pas pour les options de boosting, de bagging ou de jeux de données volumineux.
QUEST  
CHAID  
C5.0  
Liste de décision  
Linéaire Prend en charge la génération SQL pour l'option de modèle standard, mais pas pour les options de boosting, de bagging ou de jeux de données volumineux.
Réseau de neurones Prend en charge la génération SQL pour l'option de modèle standard (Multilayer Perceptron uniquement), mais pas pour les options de boosting, de bagging ou de jeux de données volumineux.
ACP/Facteur  
Logistique Prend en charge la génération SQL pour la procédure multinomiale, mais pas la procédure binomiale. Pour la procédure multinomiale, la génération n'est pas prise en charge lorsque les confiances sont sélectionnées, sauf si le type de cible est Indicateur.
Jeu de règles généré  
Classificateur automatique Si un adaptateur de scoring de type Fonction définie par l'utilisateur (UDF) est activé, ces nuggets prennent en charge la fonctionnalité SQL Pushback. En outre, si la Génération SQL pour les cibles continues ou la méthode d'ensemble La confiance la plus élevée l'emporte est utilisée, ces nuggets prennent en charge plus de répercussions en aval.
Numérisation automatique
Tableau 7. Noeuds de sorties
Noeuds prenant en charge la génération SQL Remarques
Tableau Prend en charge la génération si la génération SQL est prise en charge pour l'expression de mise en évidence.
Matrice Prend en charge la génération sauf si la fonction Toutes les valeurs numériques est sélectionnée pour l'option Champs.
Analyse La prise en charge de la génération dépend des options sélectionnées.
Transformer  
Statistiques Prend en charge la génération si l'option Corréler n'est pas utilisée.
Rapport  
Valeurs globales  
Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus