Étape de l'agrégateur : Propriétés dépendantes du calcul et du recalcul (DataStage®)
Certaines propriétés dépendent de la colonne de calcul et des variables à récapituler pour le recalcul.
Elles indiquent les différentes fonctions d'agrégation et les colonnes de sortie pour porter les résultats.
- Somme corrigée des carrés
Génère une somme corrigée de carrés pour les données de la colonne d'agrégat et les génère dans la colonne de sortie spécifiée.
- Valeur maximale
Donne la valeur maximale dans la colonne d'agrégation et la génère dans la colonne de sortie spécifiée.
- Valeur moyenne
Donne la valeur moyenne dans la colonne d'agrégat et la génère dans la colonne de sortie spécifiée.
- Valeur minimale
Donne la valeur minimale dans la colonne d'agrégation et la génère dans la colonne de sortie spécifiée.
- Valeur manquante
Cela indique ce qui constitue une valeur "manquante", par exemple -1 ou NULL. Entrez la valeur sous la forme d'un nombre à virgule flottante. Non disponible pour les variables à récapituler à recalculer.
- Nombre de valeurs manquantes
Compte le nombre de colonnes d'agrégat avec des valeurs manquantes dans ces colonnes et génère le nombre dans la colonne de sortie spécifiée. Non disponible pour le recalcul.
- Nombre de valeurs non manquantes
Compte le nombre de colonnes d'agrégat avec des valeurs dans ces colonnes et génère le nombre dans la colonne de sortie spécifiée.
- Pourcentage Coefficient de variation
Calcule le coefficient de variation du pourcentage de la colonne d'agrégat et la donne à la colonne de sortie spécifiée.
- Intervalle
Calcule la plage de valeurs dans la colonne d'agrégation et la génère dans la colonne de sortie spécifiée.
- Écart type
Calcule l'écart type des valeurs dans la colonne d'agrégat et les génère dans la colonne de sortie spécifiée.
- Erreur standard
Calcule l'erreur standard des valeurs dans la colonne d'agrégat et les génère dans la colonne de sortie spécifiée.
- Somme des poids
Calcule la somme des valeurs dans la colonne de pondération spécifiée par la propriété de la colonne Poids et la génère dans la colonne de sortie spécifiée.
- Somme
Additionne les valeurs de la colonne d'agrégat et génère la somme vers la colonne de sortie spécifiée.
- Récapitulatif
Indique un sous-enregistrement pour écrire les résultats de l'opération de calcul ou de recalcul à.
- Somme des carrés non corrigée
Génère une somme non corrigée de carrés pour les données de la colonne d'agrégat et les génère dans la colonne de sortie spécifiée.
- Variance
Calcule la variance de la colonne d'agrégat et génère la somme à la colonne de sortie spécifiée. Cela a une propriété dépendante :
- Diviseur de variance
Indique le diviseur de variance. Par défaut, utilise une valeur du nombre d'enregistrements dans le groupe moins le nombre d'enregistrements avec les valeurs manquantes moins 1 pour calculer la variance. Cela correspond à un paramètre vardiv de la valeur par défaut. Si vous spécifiez NRecs, IBM DataStage utilise le nombre d'enregistrements du groupe moins le nombre d'enregistrements avec des valeurs manquantes à la place.
- Diviseur de variance
Chacune de ces propriétés possède une propriété dépendante comme suit :
- Sortie décimale
Par défaut, toutes les colonnes de calcul ou de recalcul ont un type de sortie double. Cette propriété vous permet de spécifier que les colonnes ont un type de sortie décimal.
Lorsque vous spécifiez la sortie décimale, vous pouvez également spécifier la précision et l'échelle. Précision est le nombre de chiffres dans un nombre. La mise à l'échelle est le nombre de chiffres à droite du séparateur décimal dans un nombre. La valeur par défaut est
8,2
.Dans les cas où l'échelle de sortie requise est faible, définissez la précision et l'échelle à p + 4, s + 4 pour obtenir des résultats précis. Si une colonne a une précision et une échelle de
4,1
, dans le type de données décimal, définissez la précision et l'échelle sur9,5
.Par exemple, une colonne contenant les valeurs :
Vous pouvez utiliser le type décimal pour les calculs intermédiaires des différentes options de réduction. La précision décimale et l'échelle doivent être suffisamment grandes pour éviter l'arrondi des calculs intermédiaires. Par exemple, si vous calculez la valeur moyenne d'une décimale avec une précision de taille 8 et une échelle 2, la taille décimale intermédiaire doit être définie avec une précision d'au moins 10 et une échelle 4." 004.0"," 010.0"," 004.0"," 006.0"," 010.0"," 008.0"," 009.0"," 007.0" " 010.0"," 007.0"," 010.0"," 007.0"," 010.0"
. La valeur de précision de la colonne est4
et la valeur d'échelle est1
. La sortie est calculée comme étant 7,8 si la précision et l'échelle sont définies sur9,5
. Mais, si la précision et l'échelle sont définies sur4,1
, la sortie est de 7,9. Le calcul le plus exact est 7,8.