0 / 0
Go back to the English version of the documentation
Model zwartości statystyki kolumn i model zwartości statystyki kolumn wyznaczonych parami
Last updated: 31 sie 2023
Model zwartości statystyki kolumn i model zwartości statystyki kolumn wyznaczonych parami

Model zawartości statystyk kolumn umożliwia uzyskanie dostępu do statystyk, które mogą być obliczane dla każdego pola (statystyki jednej zmiennej). Model zawartości statystyk Pairwise zapewnia dostęp do statystyk, które mogą być obliczane między parami pól lub wartości w polu.

Możliwe są następujące działania statystyczne:

  • Count
  • UniqueCount
  • ValidCount
  • Mean
  • Sum
  • Min
  • Max
  • Range
  • Variance
  • StandardDeviation
  • StandardErrorOfMean
  • Skewness
  • SkewnessStandardError
  • Kurtosis
  • KurtosisStandardError
  • Median
  • Mode
  • Pearson
  • Covariance
  • TTest
  • FTest

Niektóre wartości są odpowiednie tylko w przypadku statystyk jednokolumnowych, a inne tylko w przypadku statystyk wyznaczonych parami.

Węzły, które generują takie elementy to:

  • Węzeł Statistics: generuje statystyki kolumnowe i może generować statystyki parami, gdy określone są zmienne korelacji
  • Węzeł Audyt danych generuje statystyki kolumnowe i może generować statystyki parami, gdy określona jest zmienna nakładkowa.
  • Węzeł Średnie generuje statystyki parami przy porównywaniu par zmiennych lub porównywaniu wartości zmiennej z innymi podsumowaniami zmiennych.

Które modele treści i statystyki są dostępne, zależy zarówno od możliwości danego węzła, jak i od ustawień w obrębie węzła.

Tabela 1. Metody dla modelu treści statystyki kolumny
Metoda Typy zwracanych wartości Opis
getAvailableStatistics() List<StatisticType> Zwraca wszystkie statystyki dostępne w tym modelu. Nie wszystkie pola muszą mieć wartości dla wszystkich statystyk.
getAvailableColumns() List<String> Zwraca nazwy kolumn, dla których obliczono statystyki.
getStatistic(String column, StatisticType statistic) Number Zwraca wartości statystyk powiązane z kolumną.
reset() void Opróżnia wewnętrzną pamięć związaną z tym modelem zawartości.
Tabela 2. Metody dla modelu treści Statystyki Pairwise
Metoda Typy zwracanych wartości Opis
getAvailableStatistics() List<StatisticType> Zwraca wszystkie statystyki dostępne w tym modelu. Nie wszystkie pola muszą mieć wartości dla wszystkich statystyk.
getAvailablePrimaryColumns() List<String> Zwraca nazwy głównych kolumn, dla których obliczono statystyki.
getAvailablePrimaryValues() List<Object> Zwraca wartości głównej kolumny, dla której obliczono statystyki.
getAvailableSecondaryColumns() List<String> Zwraca nazwy dodatkowych kolumn, dla których obliczono statystyki.
getStatistic(String primaryColumn, String secondaryColumn, StatisticType statistic) Number Zwraca wartości statystyk powiązane z kolumnami.
getStatistic(String primaryColumn, Object primaryValue, String secondaryColumn, StatisticType statistic) Number Zwraca wartości statystyk powiązane z wartością głównej kolumny i kolumną dodatkową.
reset() void Opróżnia wewnętrzną pamięć związaną z tym modelem zawartości.

Węzły i wyniki

Ta tabela zawiera listę węzłów, które budują dane wyjściowe, które zawierają ten typ modelu treści.

Tabela 3. Węzły i wyniki
Nazwa węzła Nazwa wyniku Identyfikator kontenera Uwagi
"means" (węzeł Średnie) "means" "columnStatistics"  
"means" (węzeł Średnie) "means" "pairwiseStatistics"  
"dataaudit" (węzeł Audyt danych) "means" "columnStatistics"  
"statistics" (węzeł Statistics) "statistics" "columnStatistics" Generowany tylko wtedy, gdy badane są określone zmienne.
"statistics" (węzeł Statistics) "statistics" "pairwiseStatistics" Generowany tylko wtedy, gdy zmienne są skorelowane.

Przykładowy skrypt

from modeler.api import StatisticType
stream = modeler.script.stream()

# Set up the input data
varfile = stream.createAt("variablefile", "File", 96, 96)
varfile.setPropertyValue("full_filename", "$CLEO/DEMOS/DRUG1n")

# Now create the statistics node. This can produce both
# column statistics and pairwise statistics
statisticsnode = stream.createAt("statistics", "Stats", 192, 96)
statisticsnode.setPropertyValue("examine", ["Age", "Na", "K"])
statisticsnode.setPropertyValue("correlate", ["Age", "Na", "K"])
stream.link(varfile, statisticsnode)

results = []
statisticsnode.run(results)
statsoutput = results[0]
statscm = statsoutput.getContentModel("columnStatistics")
if (statscm != None):
	cols = statscm.getAvailableColumns()
	stats = statscm.getAvailableStatistics()
	print "Column stats:", cols[0], str(stats[0]), " = ", statscm.getStatistic(cols[0], stats[0])

statscm = statsoutput.getContentModel("pairwiseStatistics")
if (statscm != None):
	pcols = statscm.getAvailablePrimaryColumns()
	scols = statscm.getAvailableSecondaryColumns()
	stats = statscm.getAvailableStatistics()
	corr = statscm.getStatistic(pcols[0], scols[0], StatisticType.Pearson)
	print "Pairwise stats:", pcols[0], scols[0], " Pearson = ", corr