0 / 0
Go back to the English version of the documentation
Model obsahu Statistika sloupců a model obsahu Pirwise Statistics
Last updated: 31. 8. 2023
Model obsahu Statistika sloupců a model obsahu Pirwise Statistics

Model obsahu Statistika sloupců poskytuje přístup k statistikám, které lze vypočítat pro každé pole (statistiky univariate). Model obsahu Pirwise Statistics poskytuje přístup k statistickým údajům, které lze vypočítat mezi páry polí nebo hodnot v poli.

Kterákoli z těchto statistických opatření je možné:

  • Count
  • UniqueCount
  • ValidCount
  • Mean
  • Sum
  • Min
  • Max
  • Range
  • Variance
  • StandardDeviation
  • StandardErrorOfMean
  • Skewness
  • SkewnessStandardError
  • Kurtosis
  • KurtosisStandardError
  • Median
  • Mode
  • Pearson
  • Covariance
  • TTest
  • FTest

Některé hodnoty jsou vhodné pouze z jedné statistiky sloupců, zatímco jiné jsou vhodné pouze pro statistiku po dvojicích.

Uzly, které produkují tyto jsou:

  • Uzel statistiky vytváří statistiky sloupců a může vytvářet statistiky po dvojicích, jsou-li určena pole korelace.
  • Uzel Audit dat produkuje sloupec a může vytvořit statistiky po dvojicích, je-li uvedeno pole překryvu.
  • Uzel znamená vytváří po porovnávání dvojic polí nebo porovnávání hodnot polí s jinými souhrny polí párové statistiky.

Které modely obsahu a statistiky jsou k dispozici, závisí na schopnostech určitého uzlu a na nastaveních v rámci uzlu.

Tabulka 1. Metody pro model obsahu statistiky sloupců
Metoda Návratové typy Popis
getAvailableStatistics() List<StatisticType> Vrátí dostupné statistiky v tomto modelu. Ne všechna pole nutně mají hodnoty pro všechny statistiky.
getAvailableColumns() List<String> Vrátí názvy sloupců, pro které byly vypočteny statistiky.
getStatistic(String column, StatisticType statistic) Number Vrátí statistické hodnoty přidružené ke sloupci.
reset() void Vyprázdní veškeré vnitřní úložiště přidružené k tomuto modelu obsahu.
Tabulka 2. Metody pro model obsahu Pirwise Statistics
Metoda Návratové typy Popis
getAvailableStatistics() List<StatisticType> Vrátí dostupné statistiky v tomto modelu. Ne všechna pole nutně mají hodnoty pro všechny statistiky.
getAvailablePrimaryColumns() List<String> Vrátí názvy primárních sloupců, pro které byly vypočteny statistické údaje.
getAvailablePrimaryValues() List<Object> Vrátí hodnoty primárního sloupce, pro který byly vypočteny statistické údaje.
getAvailableSecondaryColumns() List<String> Vrátí názvy sekundárních sloupců, pro které byly vypočteny statistiky.
getStatistic(String primaryColumn, String secondaryColumn, StatisticType statistic) Number Vrátí statistické hodnoty přidružené ke sloupcům.
getStatistic(String primaryColumn, Object primaryValue, String secondaryColumn, StatisticType statistic) Number Vrátí statistické hodnoty přidružené k hodnotě primárního sloupce a sekundárnímu sloupci.
reset() void Vyprázdní veškeré vnitřní úložiště přidružené k tomuto modelu obsahu.

Uzly a výstupy

Tato tabulka uvádí uzly, které vytvářejí výstupy, které zahrnují tento typ modelu obsahu.

Tabulka 3. Uzly a výstupy
Název uzlu Název výstupu ID kontejneru Poznámky
"means" (Střední uzel) "means" "columnStatistics"  
"means" (Střední uzel) "means" "pairwiseStatistics"  
"dataaudit" (uzel Audit dat) "means" "columnStatistics"  
"statistics" (uzel statistiky) "statistics" "columnStatistics" Generováno pouze při zkoumání specifických polí.
"statistics" (uzel statistiky) "statistics" "pairwiseStatistics" Generováno pouze, když jsou pole korelována.

Ukázkový skript

from modeler.api import StatisticType
stream = modeler.script.stream()

# Set up the input data
varfile = stream.createAt("variablefile", "File", 96, 96)
varfile.setPropertyValue("full_filename", "$CLEO/DEMOS/DRUG1n")

# Now create the statistics node. This can produce both
# column statistics and pairwise statistics
statisticsnode = stream.createAt("statistics", "Stats", 192, 96)
statisticsnode.setPropertyValue("examine", ["Age", "Na", "K"])
statisticsnode.setPropertyValue("correlate", ["Age", "Na", "K"])
stream.link(varfile, statisticsnode)

results = []
statisticsnode.run(results)
statsoutput = results[0]
statscm = statsoutput.getContentModel("columnStatistics")
if (statscm != None):
	cols = statscm.getAvailableColumns()
	stats = statscm.getAvailableStatistics()
	print "Column stats:", cols[0], str(stats[0]), " = ", statscm.getStatistic(cols[0], stats[0])

statscm = statsoutput.getContentModel("pairwiseStatistics")
if (statscm != None):
	pcols = statscm.getAvailablePrimaryColumns()
	scols = statscm.getAvailableSecondaryColumns()
	stats = statscm.getAvailableStatistics()
	corr = statscm.getStatistic(pcols[0], scols[0], StatisticType.Pearson)
	print "Pairwise stats:", pcols[0], scols[0], " Pearson = ", corr

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more