Noeuds prenant en charge la fonctionnalité SQL Pushback
Les tableaux suivants présentent les nœuds qui représentent les opérations d'exploration de données prenant en charge le pushback SQL. Si un noeud n'apparaît pas dans ces tableaux, il ne prend pas en charge la fonctionnalité SQL Pushback.
Noeuds prenant en charge la génération SQL | Remarques |
---|---|
Sélectionner | Prend en charge la génération uniquement si la génération SQL pour l'expression de sélection elle-même est prise en charge. Si des champs ont des valeurs nulles, la génération SQL ne donne pas les mêmes résultats pour la suppression que ceux donnés dans SPSS Modelernatif. |
Exemple | L'échantillonnage simple prend en charge la génération SQL à des degrés variables en fonction de la base de données. |
Agréger | La prise en charge de la génération SQL pour l'agrégation dépend du type de stockage des données. |
Agréger RFM | Prend en charge la génération sauf en cas de sauvegarde de la date de la deuxième et troisième transactions les plus récentes, ou en cas de prise en compte des transactions récentes. Toutefois, cette prise en compte fonctionne si la fonction est répercutée. |
Trier | |
Fusionner | Aucun code SQL n'est généré pour la fusion par ordre. La fusion par clé avec les jointures externe complète ou partielle est seulement prise en charge si la base de données/le pilote la prend en charge. Les champs de saisie qui ne correspondent pas peuvent être renommés à l'aide d'un nœud de filtre ou des paramètres de filtre d'un nœud d'importation. Prend en charge la génération SQL pour la fusion conditionnelle. Pour tous les types de fusion, |
Ajouter | Prend en charge la génération si les entrées ne sont pas triées. L'optimisation SQL n'est possible que lorsque les entrées possèdent le même nombre de colonnes. |
Distinguer | Un noeud Distinguer avec le mode par défaut Créer un enregistrement composite pour chaque groupe sélectionné ne prend pas en charge l'optimisation SQL. |
Mode | Exemple | Taille max | Valeur de départ | Db2 for z/OS | Db2 for OS/400 | Db2 for Win/UNIX | Oracle | SQL Server | Teradata |
---|---|---|---|---|---|---|---|---|---|
Inclure | Première valeur | n/a | Y | Y | Y | Y | Y | Y | |
Tous les | désactivé | Y | Y | Y | Y | Y | |||
max | Y | Y | Y | Y | Y | ||||
% aléatoire | désactivé | désactivé | Y | Y | Y | Y | |||
activé | Y | Y | Y | ||||||
max | désactivé | Y | Y | Y | Y | ||||
activé | Y | Y | Y | ||||||
Annuler | Première valeur | désactivé | Y | ||||||
max | Y | ||||||||
Tous les | désactivé | Y | Y | Y | Y | Y | |||
max | Y | Y | Y | Y | Y | ||||
% aléatoire | désactivé | désactivé | Y | Y | Y | Y | |||
activé | Y | Y | Y | ||||||
max | désactivé | Y | Y | Y | Y | ||||
activé | Y | Y | Y |
Stockage | Somme | Moyenne | Min | Maxi | Ecart type | Médiane | Nombre | Ecart | Percentile |
---|---|---|---|---|---|---|---|---|---|
Entier | Y | Y | Y | Y | Y | O* | Y | Y | O* |
Réel | Y | Y | Y | Y | Y | O* | Y | Y | O* |
Date : | Y | Y | O* | Y | O* | ||||
Durée | Y | Y | O* | Y | O* | ||||
Horodatage | Y | Y | O* | Y | O* | ||||
Chaîne | Y | Y | O* | Y | O* |
* La médiane et le percentile sont pris en charge sur Oracle.
Noeuds prenant en charge la génération SQL | Remarques |
---|---|
Type | La génération SQL n'est prise en charge que si le nœud Type est instancié et qu'aucune vérification de type ou n'est spécifiée. |
Filtrer | |
Calculer | La génération SQL n'est prise en charge que si le code SQL généré à partir de l'expression dérivée est valide. Cependant, SPSS Modeler ne peut pas générer SQL si vous choisissez State ou Count pour l'option Derive as.
|
Ensemble | Prend en charge la génération SQL pour les cibles continues. Pour les autres champs cible, prend uniquement en charge la génération si la méthode d'ensemble La plus grande confiance gagne est utilisée. |
Remplacer | La génération SQL est prise en charge si le code SQL généré à partir de l'expression dérivée est valide. |
Anonymiser | Prend en charge la génération SQL pour les cibles continues, et une génération SQL partielle pour les cibles nominales et indicateurs. |
Recoder | |
Regroupement par casiers | La génération SQL est prise en charge si la méthode de regroupement des tuiles (nombre égal) est utilisée et si l'option Lire à partir de l'onglet Valeurs de regroupement si disponible est sélectionnée. En raison des différences dans le mode de calcul des limites de casiers (du fait de la nature de la répartition des données dans les champs de casier), vous pouvez constater des écarts dans la sortie du regroupement par casiers lorsque vous comparez l'exécution de flux normale avec les résultats de SQL Pushback. Pour éviter ceci, utilisez la méthode de création de quantiles Nombre d'enregistrements et les quantiles Ajouter au suivant ou Conserver dans l'élément actuel pour obtenir la correspondance la plus proche entre les deux méthodes d'exécution de flux. |
Analyse RFM | La génération SQL est prise en charge si l'option Lire à partir de l'onglet Valeurs de l'emplacement si disponible est sélectionnée, mais les nœuds en aval ne la prendront pas en charge. |
Partition | Prend en charge la génération SQL pour affecter des enregistrements aux partitions. |
Binariser | |
Restructurer |
Noeuds prenant en charge la génération SQL | Remarques |
---|---|
Distribution | |
Web | |
Evaluation |
Pour certains modèles, il est possible de générer une instruction SQL pour le nugget de modèle, en répercutant l'étape de scoring de modèle dans la base de données. L'utilisation principale de cette caractéristique n'est pas d'améliorer les performances, mais d'autoriser des flux contenant ces nuggets à voir l'intégralité de leur instruction SQL répercutée. Pour plus d'informations, voir Générer du code SQL à partir de nuggets de modèle.
Nuggets de modèle prenant en charge la génération SQL | Remarques |
---|---|
Arbre C&RT | Prend en charge la génération SQL pour l'option d'arbre unique, mais pas pour les options de boosting, de bagging ou de jeux de données volumineux. |
QUEST | |
CHAID | |
C5.0 | |
Liste de décision | |
Linéaire | Prend en charge la génération SQL pour l'option de modèle standard, mais pas pour les options de boosting, de bagging ou de jeux de données volumineux. |
Réseau de neurones | Prend en charge la génération SQL pour l'option de modèle standard (Multilayer Perceptron uniquement), mais pas pour les options de boosting, de bagging ou de jeux de données volumineux. |
ACP/Facteur | |
Logistique | Prend en charge la génération SQL pour la procédure multinomiale, mais pas la procédure binomiale. Pour la procédure multinomiale, la génération n'est pas prise en charge lorsque les confiances sont sélectionnées, sauf si le type de cible est Indicateur. |
Jeu de règles généré | |
Classificateur automatique | Si un adaptateur de scoring de type Fonction définie par l'utilisateur (UDF) est activé, ces nuggets prennent en charge la fonctionnalité SQL Pushback. En outre, si la Génération SQL pour les cibles continues ou la méthode d'ensemble La confiance la plus élevée l'emporte est utilisée, ces nuggets prennent en charge plus de répercussions en aval. |
Numérisation automatique |
Noeuds prenant en charge la génération SQL | Remarques |
---|---|
Tableau | Prend en charge la génération si la génération SQL est prise en charge pour l'expression de mise en évidence. |
Matrice | Prend en charge la génération sauf si la fonction Toutes les valeurs numériques est sélectionnée pour l'option Champs. |
Analyse | La prise en charge de la génération dépend des options sélectionnées. |
Transformer | |
Statistiques | Prend en charge la génération si l'option Corréler n'est pas utilisée. |
Rapport | |
Valeurs globales |