Les tableaux de cette section contiennent des noeuds qui représentent des opérations d'exploration de données prenant en charge la fonctionnalité SQL Pushback. Si un noeud n'apparaît pas dans ces tableaux, il ne prend pas en charge la fonctionnalité SQL Pushback.
Tableau 1. Noeuds d'opérations sur les lignes
Noeuds prenant en charge la génération SQL |
Remarques |
Sélectionner |
Prend en charge la génération uniquement si la génération SQL pour l'expression de sélection elle-même est prise en charge. Si des champs ont des valeurs nulles, la génération SQL ne donne pas les mêmes résultats pour la suppression que ceux donnés dans SPSS Modelernatif. |
Exemple |
L'échantillonnage simple prend en charge la génération SQL à des degrés variables
en fonction de la base de données. |
Agréger |
La prise en charge de la génération SQL pour l'agrégation dépend du type de stockage des données. |
Agréger RFM |
Prend en charge la génération sauf en cas de sauvegarde de la date de la deuxième et troisième transactions les plus récentes, ou en cas de prise en compte des transactions récentes. Toutefois, cette prise en compte fonctionne si la fonction datetime_date(YEAR,MONTH,DAY) est répercutée. |
Trier |
|
Fusionner |
Aucun code SQL n'est généré pour la fusion par ordre. La fusion par clé avec les jointures externe complète ou partielle est seulement prise en charge si la base de données/le pilote la prend en charge. Vous pouvez renommer les champs d'entrées qui ne correspondent pas à l'aide du noeud Filtre ou des paramètres Filtre d'un noeud d'importation.
Prend en charge la génération SQL pour la fusion conditionnelle.
Pour tous les types de fusion, SQL_SP_EXISTS n'est pas pris en charge si les entrées proviennent de bases de données différentes.
|
Ajouter |
Prend en charge la génération si les entrées ne sont pas triées. L'optimisation SQL n'est possible que lorsque les entrées possèdent le même nombre de colonnes. |
Distinguer |
Un noeud Distinguer avec le mode par défaut Créer un enregistrement composite pour chaque groupe sélectionné ne prend pas en charge l'optimisation SQL. |
Tableau 2. Prise en charge de la génération SQL dans le noeud Echantillonner pour l'échantillonnage simple
Mode |
Exemple |
Taille max |
Valeur de départ |
Db2 for z/OS |
Db2 for OS/400 |
Db2 for Win/UNIX |
Oracle |
SQL Server |
Teradata |
Inclure |
Première valeur |
n/a |
|
Y |
Y |
Y |
Y |
Y |
Y |
|
Tous les |
désactivé |
|
Y |
Y |
Y |
Y |
|
Y |
|
|
max |
|
Y |
Y |
Y |
Y |
|
Y |
|
% aléatoire |
désactivé |
désactivé |
Y |
|
Y |
Y |
|
Y |
|
|
|
activé |
Y |
|
Y |
Y |
|
|
|
|
max |
désactivé |
Y |
|
Y |
Y |
|
Y |
|
|
|
activé |
Y |
|
Y |
Y |
|
|
Annuler |
Première valeur |
désactivé |
|
|
|
|
Y |
|
|
|
|
max |
|
|
|
|
Y |
|
|
|
Tous les |
désactivé |
|
Y |
Y |
Y |
Y |
|
Y |
|
|
max |
|
Y |
Y |
Y |
Y |
|
Y |
|
% aléatoire |
désactivé |
désactivé |
Y |
|
Y |
Y |
|
Y |
|
|
|
activé |
Y |
|
Y |
Y |
|
|
|
|
max |
désactivé |
Y |
|
Y |
Y |
|
Y |
|
|
|
activé |
Y |
|
Y |
Y |
|
|
Tableau 3. Prise en charge de la génération SQL dans le noeud Agréger
Stockage |
Somme |
Moyenne |
Min |
Maxi |
Ecart type |
Médiane |
Nombre |
Ecart |
Percentile |
Entier |
Y |
Y |
Y |
Y |
Y |
O* |
Y |
Y |
O* |
Réel |
Y |
Y |
Y |
Y |
Y |
O* |
Y |
Y |
O* |
Date : |
|
|
Y |
Y |
|
O* |
Y |
|
O* |
Durée |
|
|
Y |
Y |
|
O* |
Y |
|
O* |
Horodatage |
|
|
Y |
Y |
|
O* |
Y |
|
O* |
Chaîne |
|
|
Y |
Y |
|
O* |
Y |
|
O* |
* La médiane et le percentile sont pris en charge sur Oracle.
Tableau 4. noeuds d'opérations sur les champs
Noeuds prenant en charge la génération SQL |
Remarques |
Type |
Ce noeud prend en charge la génération SQL si le noeud Typer est instancié, et qu'aucune vérification de type ABORT ou WARN n'est indiquée. |
Filtrer |
|
Calculer |
Prend en charge la génération SQL si le code SQL généré pour l'expression dérivée est pris en charge (voir les expressions plus loin sur cette page). |
Ensemble |
Prend en charge la génération SQL pour les cibles continues. Pour les autres champs cible, prend uniquement en charge la génération si la méthode d'ensemble La plus grande confiance gagne est utilisée. |
Remplacer |
Prend en charge la génération SQL si le code SQL généré pour l'expression dérivée est pris en charge. |
Anonymiser |
Prend en charge la génération SQL pour les cibles continues, et une génération SQL partielle pour les cibles nominales et indicateurs. |
Recoder |
|
Regroupement par casiers |
Prend en charge la génération SQL si la méthode de regroupement par casiers de type Quantiles (nombres égaux) est utilisée et que l'option Lire à partir de l'onglet Valeurs de casier si disponible est sélectionnée. En raison des différences dans le mode de calcul des limites de casiers (du fait de la nature de la répartition des données dans les
champs de casier), vous pouvez constater des écarts dans la sortie du regroupement par casiers lorsque vous comparez l'exécution de flux normale avec les résultats de SQL Pushback. Pour éviter ceci, utilisez la méthode de création de quantiles Nombre d'enregistrements et les quantiles
Ajouter au suivant ou Conserver dans l'élément actuel pour obtenir la correspondance la plus proche entre les deux méthodes d'exécution de flux. |
Analyse RFM |
Prend en charge la génération SQL si l'option Lire dans l'onglet Valeurs d'intervalle si disponible est sélectionnée mais les noeuds en aval ne prennent pas en charge la génération SQL. |
Partition |
Prend en charge la génération SQL pour affecter des enregistrements aux partitions. |
Binariser |
|
Restructurer |
|
Tableau 5. Noeuds de graphiques
Noeuds prenant en charge la génération SQL |
Remarques |
Distribution |
|
Web |
|
Evaluation |
|
Pour certains modèles, il est possible de générer une instruction SQL pour le nugget de modèle, en répercutant l'étape de scoring de modèle dans la base de données. L'utilisation principale de cette caractéristique n'est pas d'améliorer les performances, mais d'autoriser des flux contenant ces nuggets à voir l'intégralité de leur instruction SQL répercutée. Pour plus d'informations, voir Génération de SQL à partir de nuggets de modèle .
Tableau 6. nuggets de modèle
Nuggets de modèle prenant en charge la génération SQL |
Remarques |
Arbre C&RT |
Prend en charge la génération SQL pour l'option d'arbre unique, mais pas pour les options de boosting, de bagging ou de jeux de données volumineux. |
QUEST |
|
CHAID |
|
C5.0 |
|
Liste de décision |
|
Linéaire |
Prend en charge la génération SQL pour l'option de modèle standard, mais pas pour les options de boosting, de bagging ou de jeux de données volumineux. |
Réseau de neurones |
Prend en charge la génération SQL pour l'option de modèle standard (Multilayer Perceptron uniquement), mais pas pour les options de boosting, de bagging ou de jeux de données volumineux. |
ACP/Facteur |
|
Logistique |
Prend en charge la génération SQL pour la procédure multinomiale, mais pas la procédure binomiale. Pour la procédure multinomiale, la génération n'est pas prise en charge lorsque les confiances sont sélectionnées, sauf si le type de cible est Indicateur. |
Jeu de règles généré |
|
Classificateur automatique |
Si un adaptateur de scoring de type Fonction définie par l'utilisateur
(UDF) est activé, ces nuggets prennent en charge la fonctionnalité SQL Pushback. En outre,
si la Génération SQL pour les cibles continues ou la méthode d'ensemble La confiance la plus élevée
l'emporte est utilisée, ces nuggets prennent en charge plus de répercussions en aval. |
Numérisation automatique |
Tableau 7. Noeuds de sorties
Noeuds prenant en charge la génération SQL |
Remarques |
Tableau |
Prend en charge la génération si la génération SQL est prise en charge pour l'expression de mise en évidence. |
Matrice |
Prend en charge la génération sauf si la fonction Toutes les valeurs numériques est sélectionnée pour l'option Champs. |
Analyse |
La prise en charge de la génération dépend des options sélectionnées. |
Transformer |
|
Statistiques |
Prend en charge la génération si l'option Corréler n'est pas utilisée. |
Rapport |
|
Valeurs globales |
|