Noeuds prenant en charge la fonctionnalité SQL Pushback

Dernière mise à jour : 15 avr. 2025

Optimisation SQL (SPSS Modeler)

Les tableaux suivants présentent les nœuds qui représentent les opérations d'exploration de données prenant en charge le pushback SQL. Si un noeud n'apparaît pas dans ces tableaux, il ne prend pas en charge la fonctionnalité SQL Pushback.

Tableau 1. Noeuds d'opérations sur les lignes
Noeuds prenant en charge la génération SQL	Remarques
Sélectionner	Prend en charge la génération uniquement si la génération SQL pour l'expression de sélection elle-même est prise en charge. Si des champs ont des valeurs nulles, la génération SQL ne donne pas les mêmes résultats pour la suppression que ceux donnés dans SPSS Modelernatif.
Exemple	L'échantillonnage simple prend en charge la génération SQL à des degrés variables en fonction de la base de données.
Agréger	La prise en charge de la génération SQL pour l'agrégation dépend du type de stockage des données.
Agréger RFM	Prend en charge la génération sauf en cas de sauvegarde de la date de la deuxième et troisième transactions les plus récentes, ou en cas de prise en compte des transactions récentes. Toutefois, cette prise en compte fonctionne si la fonction `datetime_date(YEAR,MONTH,DAY)` est répercutée.
Trier
Fusionner	Aucun code SQL n'est généré pour la fusion par ordre. La fusion par clé avec les jointures externe complète ou partielle est seulement prise en charge si la base de données/le pilote la prend en charge. Les champs de saisie qui ne correspondent pas peuvent être renommés à l'aide d'un nœud de filtre ou des paramètres de filtre d'un nœud d'importation. Prend en charge la génération SQL pour la fusion conditionnelle. Pour tous les types de fusion, `SQL_SP_EXISTS` n'est pas pris en charge si les entrées proviennent de bases de données différentes.
Ajouter	Prend en charge la génération si les entrées ne sont pas triées. L'optimisation SQL n'est possible que lorsque les entrées possèdent le même nombre de colonnes.
Distinguer	Un noeud Distinguer avec le mode par défaut Créer un enregistrement composite pour chaque groupe sélectionné ne prend pas en charge l'optimisation SQL.

Tableau 2. Prise en charge de la génération SQL dans le noeud Echantillonner pour l'échantillonnage simple
Mode	Exemple	Taille max	Valeur de départ	Db2 for z/OS	Db2 for OS/400	Db2 for Win/UNIX	Oracle	SQL Server	Teradata
Inclure	Première valeur	n/a		Y	Y	Y	Y	Y	Y
	Tous les	désactivé		Y	Y	Y	Y		Y
		max		Y	Y	Y	Y		Y
	% aléatoire	désactivé	désactivé	Y		Y	Y		Y
			activé	Y		Y	Y
		max	désactivé	Y		Y	Y		Y
			activé	Y		Y	Y
Annuler	Première valeur	désactivé					Y
		max					Y
	Tous les	désactivé		Y	Y	Y	Y		Y
		max		Y	Y	Y	Y		Y
	% aléatoire	désactivé	désactivé	Y		Y	Y		Y
			activé	Y		Y	Y
		max	désactivé	Y		Y	Y		Y
			activé	Y		Y	Y

Tableau 3. Prise en charge de la génération SQL dans le noeud Agréger
Stockage	Somme	Moyenne	Min	Maxi	Ecart type	Médiane	Nombre	Ecart	Percentile
Entier	Y	Y	Y	Y	Y	O*	Y	Y	O*
Réel	Y	Y	Y	Y	Y	O*	Y	Y	O*
Date :			Y	Y		O*	Y		O*
Durée			Y	Y		O*	Y		O*
Horodatage			Y	Y		O*	Y		O*
Chaîne			Y	Y		O*	Y		O*

* La médiane et le percentile sont pris en charge sur Oracle.

Tableau 4. noeuds d'opérations sur les champs
Noeuds prenant en charge la génération SQL	Remarques
Type	La génération SQL n'est prise en charge que si le nœud Type est instancié et qu'aucune vérification de type `ABORT` ou `WARN` n'est spécifiée.
Filtrer
Calculer	La génération SQL n'est prise en charge que si le code SQL généré à partir de l'expression dérivée est valide. Cependant, SPSS Modeler ne peut pas générer SQL si vous choisissez State ou Count pour l'option Derive as. STATE ne peut pas être traduit en SQL car il dépend d'un suivi d'état persistant, que SQL ne gère pas de manière inhérente. COUNT nécessite le maintien d'un total courant, ce que le langage SQL standard ne permet pas non plus.
Ensemble	Prend en charge la génération SQL pour les cibles continues. Pour les autres champs cible, prend uniquement en charge la génération si la méthode d'ensemble La plus grande confiance gagne est utilisée.
Remplacer	La génération SQL est prise en charge si le code SQL généré à partir de l'expression dérivée est valide.
Anonymiser	Prend en charge la génération SQL pour les cibles continues, et une génération SQL partielle pour les cibles nominales et indicateurs.
Recoder
Regroupement par casiers	La génération SQL est prise en charge si la méthode de regroupement des tuiles (nombre égal) est utilisée et si l'option Lire à partir de l'onglet Valeurs de regroupement si disponible est sélectionnée. En raison des différences dans le mode de calcul des limites de casiers (du fait de la nature de la répartition des données dans les champs de casier), vous pouvez constater des écarts dans la sortie du regroupement par casiers lorsque vous comparez l'exécution de flux normale avec les résultats de SQL Pushback. Pour éviter ceci, utilisez la méthode de création de quantiles Nombre d'enregistrements et les quantiles Ajouter au suivant ou Conserver dans l'élément actuel pour obtenir la correspondance la plus proche entre les deux méthodes d'exécution de flux.
Analyse RFM	La génération SQL est prise en charge si l'option Lire à partir de l'onglet Valeurs de l'emplacement si disponible est sélectionnée, mais les nœuds en aval ne la prendront pas en charge.
Partition	Prend en charge la génération SQL pour affecter des enregistrements aux partitions.
Binariser
Restructurer

Tableau 5. Noeuds de graphiques
Noeuds prenant en charge la génération SQL	Remarques
Distribution
Web
Evaluation

Pour certains modèles, il est possible de générer une instruction SQL pour le nugget de modèle, en répercutant l'étape de scoring de modèle dans la base de données. L'utilisation principale de cette caractéristique n'est pas d'améliorer les performances, mais d'autoriser des flux contenant ces nuggets à voir l'intégralité de leur instruction SQL répercutée. Pour plus d'informations, voir Générer du code SQL à partir de nuggets de modèle.

Tableau 6. nuggets de modèle
Nuggets de modèle prenant en charge la génération SQL	Remarques
Arbre C&RT	Prend en charge la génération SQL pour l'option d'arbre unique, mais pas pour les options de boosting, de bagging ou de jeux de données volumineux.
QUEST
CHAID
C5.0
Liste de décision
Linéaire	Prend en charge la génération SQL pour l'option de modèle standard, mais pas pour les options de boosting, de bagging ou de jeux de données volumineux.
Réseau de neurones	Prend en charge la génération SQL pour l'option de modèle standard (Multilayer Perceptron uniquement), mais pas pour les options de boosting, de bagging ou de jeux de données volumineux.
ACP/Facteur
Logistique	Prend en charge la génération SQL pour la procédure multinomiale, mais pas la procédure binomiale. Pour la procédure multinomiale, la génération n'est pas prise en charge lorsque les confiances sont sélectionnées, sauf si le type de cible est Indicateur.
Jeu de règles généré
Classificateur automatique	Si un adaptateur de scoring de type Fonction définie par l'utilisateur (UDF) est activé, ces nuggets prennent en charge la fonctionnalité SQL Pushback. En outre, si la Génération SQL pour les cibles continues ou la méthode d'ensemble La confiance la plus élevée l'emporte est utilisée, ces nuggets prennent en charge plus de répercussions en aval.
Numérisation automatique

Tableau 7. Noeuds de sorties
Noeuds prenant en charge la génération SQL	Remarques
Tableau	Prend en charge la génération si la génération SQL est prise en charge pour l'expression de mise en évidence.
Matrice	Prend en charge la génération sauf si la fonction Toutes les valeurs numériques est sélectionnée pour l'option Champs.
Analyse	La prise en charge de la génération dépend des options sélectionnées.
Transformer
Statistiques	Prend en charge la génération si l'option Corréler n'est pas utilisée.
Rapport
Valeurs globales

La rubrique a-t-elle été utile ?

0/1000