Translation not up to date
Model zawartości statystyk kolumn umożliwia uzyskanie dostępu do statystyk, które mogą być obliczane dla każdego pola (statystyki jednej zmiennej). Model zawartości statystyk Pairwise zapewnia dostęp do statystyk, które mogą być obliczane między parami pól lub wartości w polu.
Możliwe są następujące działania statystyczne:
Count
UniqueCount
ValidCount
Mean
Sum
Min
Max
Range
Variance
StandardDeviation
StandardErrorOfMean
Skewness
SkewnessStandardError
Kurtosis
KurtosisStandardError
Median
Mode
Pearson
Covariance
TTest
FTest
Niektóre wartości są odpowiednie tylko w przypadku statystyk jednokolumnowych, a inne tylko w przypadku statystyk wyznaczonych parami.
Węzły, które generują takie elementy to:
- Węzeł Statistics: generuje statystyki kolumnowe i może generować statystyki parami, gdy określone są zmienne korelacji
- Węzeł Audyt danych generuje statystyki kolumnowe i może generować statystyki parami, gdy określona jest zmienna nakładkowa.
- Węzeł Średnie generuje statystyki parami przy porównywaniu par zmiennych lub porównywaniu wartości zmiennej z innymi podsumowaniami zmiennych.
Które modele treści i statystyki są dostępne, zależy zarówno od możliwości danego węzła, jak i od ustawień w obrębie węzła.
Metoda | Typy zwracanych wartości | Opis |
---|---|---|
getAvailableStatistics() |
List<StatisticType> |
Zwraca wszystkie statystyki dostępne w tym modelu. Nie wszystkie pola muszą mieć wartości dla wszystkich statystyk. |
getAvailableColumns() |
List<String> |
Zwraca nazwy kolumn, dla których obliczono statystyki. |
getStatistic(String column, StatisticType statistic) |
Number |
Zwraca wartości statystyk powiązane z kolumną. |
reset() |
void |
Opróżnia wewnętrzną pamięć związaną z tym modelem zawartości. |
Metoda | Typy zwracanych wartości | Opis |
---|---|---|
getAvailableStatistics() |
List<StatisticType> |
Zwraca wszystkie statystyki dostępne w tym modelu. Nie wszystkie pola muszą mieć wartości dla wszystkich statystyk. |
getAvailablePrimaryColumns() |
List<String> |
Zwraca nazwy głównych kolumn, dla których obliczono statystyki. |
getAvailablePrimaryValues() |
List<Object> |
Zwraca wartości głównej kolumny, dla której obliczono statystyki. |
getAvailableSecondaryColumns() |
List<String> |
Zwraca nazwy dodatkowych kolumn, dla których obliczono statystyki. |
getStatistic(String primaryColumn, String secondaryColumn, StatisticType
statistic) |
Number |
Zwraca wartości statystyk powiązane z kolumnami. |
getStatistic(String primaryColumn, Object primaryValue, String secondaryColumn,
StatisticType statistic) |
Number |
Zwraca wartości statystyk powiązane z wartością głównej kolumny i kolumną dodatkową. |
reset() |
void |
Opróżnia wewnętrzną pamięć związaną z tym modelem zawartości. |
Węzły i wyniki
Ta tabela zawiera listę węzłów, które budują dane wyjściowe, które zawierają ten typ modelu treści.
Nazwa węzła | Nazwa wyniku | Identyfikator kontenera | Uwagi |
---|---|---|---|
"means" (węzeł Średnie) |
"means" |
"columnStatistics" |
|
"means" (węzeł Średnie) |
"means" |
"pairwiseStatistics" |
|
"dataaudit" (węzeł Audyt danych) |
"means" |
"columnStatistics" |
|
"statistics" (węzeł Statistics) |
"statistics" |
"columnStatistics" |
Generowany tylko wtedy, gdy badane są określone zmienne. |
"statistics" (węzeł Statistics) |
"statistics" |
"pairwiseStatistics" |
Generowany tylko wtedy, gdy zmienne są skorelowane. |
Przykładowy skrypt
from modeler.api import StatisticType
stream = modeler.script.stream()
# Set up the input data
varfile = stream.createAt("variablefile", "File", 96, 96)
varfile.setPropertyValue("full_filename", "$CLEO/DEMOS/DRUG1n")
# Now create the statistics node. This can produce both
# column statistics and pairwise statistics
statisticsnode = stream.createAt("statistics", "Stats", 192, 96)
statisticsnode.setPropertyValue("examine", ["Age", "Na", "K"])
statisticsnode.setPropertyValue("correlate", ["Age", "Na", "K"])
stream.link(varfile, statisticsnode)
results = []
statisticsnode.run(results)
statsoutput = results[0]
statscm = statsoutput.getContentModel("columnStatistics")
if (statscm != None):
cols = statscm.getAvailableColumns()
stats = statscm.getAvailableStatistics()
print "Column stats:", cols[0], str(stats[0]), " = ", statscm.getStatistic(cols[0], stats[0])
statscm = statsoutput.getContentModel("pairwiseStatistics")
if (statscm != None):
pcols = statscm.getAvailablePrimaryColumns()
scols = statscm.getAvailableSecondaryColumns()
stats = statscm.getAvailableStatistics()
corr = statscm.getStatistic(pcols[0], scols[0], StatisticType.Pearson)
print "Pairwise stats:", pcols[0], scols[0], " Pearson = ", corr