Fase dell'aggregatore: Proprietà dipendenti dal calcolo e dal ricalcolo (DataStage®)
Alcune proprietà sono dipendenti sia della colonna per il calcolo che della colonna di riepilogo per il ricalcolo.
Questi specificano le varie funzioni aggregate e le colonne di output per trasportare i risultati.
- Somma dei quadrati corretta
Produce una somma dei quadrati corretta per i dati nella colonna di aggregazione e la restituisce alla colonna di output specificata.
- Valore massimo
Fornisce il valore massimo nella colonna di aggregazione e lo restituisce alla colonna di output specificata.
- Valore medio
Fornisce il valore medio nella colonna di aggregazione e lo restituisce alla colonna di output specificata.
- Valore minimo
Fornisce il valore minimo nella colonna di aggregazione e lo restituisce alla colonna di output specificata.
- Valore mancante
Specifica cosa costituisce un valore "mancante", ad esempio -1 o NULL. Immettere il valore come numero a virgola mobile. Non disponibile per la colonna di riepilogo da ricalcolare.
- Conteggio valori mancanti
Conta il numero di colonne aggregate con valori mancanti e restituisce il conteggio alla colonna di output specificata. Non disponibile per il ricalcolo.
- Conteggio valori non mancanti
Conta il numero di colonne aggregate con valori e restituisce il conteggio alla colonna di output specificata.
- Coefficiente di variazione in percentuale
Calcola il coefficiente percentuale di variazione per la colonna aggregata e la restituisce alla colonna di output specificata.
- Intervallo
Calcola l'intervallo di valori nella colonna di aggregazione e ne esegue l'output nella colonna di output specificata.
- Deviazione standard
Calcola la deviazione standard dei valori nella colonna di aggregazione e la restituisce nella colonna di output specificata.
- Errore standard
Calcola l'errore standard dei valori nella colonna di aggregazione e lo restituisce alla colonna di output specificata.
- Somma dei pesi
Calcola la somma dei valori nella colonna peso specificata dalla proprietà Colonna peso e la restituisce alla colonna di output specificata.
- Somma
Somma i valori nella colonna aggregata e restituisce la somma alla colonna di output specificata.
- Riepilogo
Specifica un record secondario in cui scrivere i risultati dell'operazione di calcolo o ricalcolo.
- Somma dei quadrati non corretta
Produce una somma dei quadrati non corretta per i dati nella colonna di aggregazione e la restituisce alla colonna di output specificata.
- Varianza
Calcola la varianza per la colonna aggregata e restituisce la somma alla colonna di output specificata. Questa ha una proprietà dipendente:
- Divisore varianza
Specifica il divisore della varianza. Per impostazione predefinita, utilizza un valore del numero di record nel gruppo meno il numero di record con valori mancanti meno 1 per calcolare la varianza. Ciò corrisponde ad un'impostazione vardiv di Default. Se si specifica NRecs, IBM DataStage utilizza il numero di record nel gruppo meno il numero di record con valori mancanti.
- Divisore varianza
Ognuna di queste proprietà ha una proprietà dipendente come segue:
- Output decimale
Per impostazione predefinita, tutte le colonne di calcolo o di ricalcolo hanno un tipo di output doppio. Questa proprietà consente di specificare che le colonne hanno un tipo di output decimale.
Quando si specifica l'output decimale, è anche possibile specificare precisione e scala. Precisione è il numero di cifre in un numero. Scala è il numero di cifre a destra del punto decimale in un numero. Il valore predefinito è
8,2
.Nei casi in cui la scala di output richiesta è bassa, impostare la precisione e la scala su p+4, s+4 per ottenere risultati precisi. Se una colonna ha una precisione e una scala di
4,1
, nel tipo di dati decimali, impostare la precisione e la scala su9,5
.Ad esempio, una colonna con valori:
È possibile utilizzare il tipo decimale per calcoli intermedi delle diverse opzioni di riduzione. La precisione decimale e la scala devono essere abbastanza grandi da evitare l'arrotondamento dei calcoli intermedi. Ad esempio, se si sta calcolando il valore medio di un decimale con precisione 8 e scala 2, la dimensione decimale intermedia deve essere impostata almeno su precisione 10 e scala 4." 004.0"," 010.0"," 004.0"," 006.0"," 010.0"," 008.0"," 009.0"," 007.0" " 010.0"," 007.0"," 010.0"," 007.0"," 010.0"
. Il valore di precisione per la colonna è4
e il valore di scala1
. L'output viene calcolato come 7.8 se la precisione e la scala sono impostate su9,5
. Ma se la precisione e la scala sono impostate su4,1
, l'output è 7.9. Il calcolo più accurato è 7.8.