Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 31. 8. 2023
Model obsahu Statistika sloupců poskytuje přístup k statistikám, které lze vypočítat pro každé pole (statistiky univariate). Model obsahu Pirwise Statistics poskytuje přístup k statistickým údajům, které lze vypočítat mezi páry polí nebo hodnot v poli.
Kterákoli z těchto statistických opatření je možné:
Count
UniqueCount
ValidCount
Mean
Sum
Min
Max
Range
Variance
StandardDeviation
StandardErrorOfMean
Skewness
SkewnessStandardError
Kurtosis
KurtosisStandardError
Median
Mode
Pearson
Covariance
TTest
FTest
Některé hodnoty jsou vhodné pouze z jedné statistiky sloupců, zatímco jiné jsou vhodné pouze pro statistiku po dvojicích.
Uzly, které produkují tyto jsou:
- Uzel statistiky vytváří statistiky sloupců a může vytvářet statistiky po dvojicích, jsou-li určena pole korelace.
- Uzel Audit dat produkuje sloupec a může vytvořit statistiky po dvojicích, je-li uvedeno pole překryvu.
- Uzel znamená vytváří po porovnávání dvojic polí nebo porovnávání hodnot polí s jinými souhrny polí párové statistiky.
Které modely obsahu a statistiky jsou k dispozici, závisí na schopnostech určitého uzlu a na nastaveních v rámci uzlu.
Metoda | Návratové typy | Popis |
---|---|---|
getAvailableStatistics() |
List<StatisticType> |
Vrátí dostupné statistiky v tomto modelu. Ne všechna pole nutně mají hodnoty pro všechny statistiky. |
getAvailableColumns() |
List<String> |
Vrátí názvy sloupců, pro které byly vypočteny statistiky. |
getStatistic(String column, StatisticType statistic) |
Number |
Vrátí statistické hodnoty přidružené ke sloupci. |
reset() |
void |
Vyprázdní veškeré vnitřní úložiště přidružené k tomuto modelu obsahu. |
Metoda | Návratové typy | Popis |
---|---|---|
getAvailableStatistics() |
List<StatisticType> |
Vrátí dostupné statistiky v tomto modelu. Ne všechna pole nutně mají hodnoty pro všechny statistiky. |
getAvailablePrimaryColumns() |
List<String> |
Vrátí názvy primárních sloupců, pro které byly vypočteny statistické údaje. |
getAvailablePrimaryValues() |
List<Object> |
Vrátí hodnoty primárního sloupce, pro který byly vypočteny statistické údaje. |
getAvailableSecondaryColumns() |
List<String> |
Vrátí názvy sekundárních sloupců, pro které byly vypočteny statistiky. |
getStatistic(String primaryColumn, String secondaryColumn, StatisticType
statistic) |
Number |
Vrátí statistické hodnoty přidružené ke sloupcům. |
getStatistic(String primaryColumn, Object primaryValue, String secondaryColumn,
StatisticType statistic) |
Number |
Vrátí statistické hodnoty přidružené k hodnotě primárního sloupce a sekundárnímu sloupci. |
reset() |
void |
Vyprázdní veškeré vnitřní úložiště přidružené k tomuto modelu obsahu. |
Uzly a výstupy
Tato tabulka uvádí uzly, které vytvářejí výstupy, které zahrnují tento typ modelu obsahu.
Název uzlu | Název výstupu | ID kontejneru | Poznámky |
---|---|---|---|
"means" (Střední uzel) |
"means" |
"columnStatistics" |
|
"means" (Střední uzel) |
"means" |
"pairwiseStatistics" |
|
"dataaudit" (uzel Audit dat) |
"means" |
"columnStatistics" |
|
"statistics" (uzel statistiky) |
"statistics" |
"columnStatistics" |
Generováno pouze při zkoumání specifických polí. |
"statistics" (uzel statistiky) |
"statistics" |
"pairwiseStatistics" |
Generováno pouze, když jsou pole korelována. |
Ukázkový skript
from modeler.api import StatisticType
stream = modeler.script.stream()
# Set up the input data
varfile = stream.createAt("variablefile", "File", 96, 96)
varfile.setPropertyValue("full_filename", "$CLEO/DEMOS/DRUG1n")
# Now create the statistics node. This can produce both
# column statistics and pairwise statistics
statisticsnode = stream.createAt("statistics", "Stats", 192, 96)
statisticsnode.setPropertyValue("examine", ["Age", "Na", "K"])
statisticsnode.setPropertyValue("correlate", ["Age", "Na", "K"])
stream.link(varfile, statisticsnode)
results = []
statisticsnode.run(results)
statsoutput = results[0]
statscm = statsoutput.getContentModel("columnStatistics")
if (statscm != None):
cols = statscm.getAvailableColumns()
stats = statscm.getAvailableStatistics()
print "Column stats:", cols[0], str(stats[0]), " = ", statscm.getStatistic(cols[0], stats[0])
statscm = statsoutput.getContentModel("pairwiseStatistics")
if (statscm != None):
pcols = statscm.getAvailablePrimaryColumns()
scols = statscm.getAvailableSecondaryColumns()
stats = statscm.getAvailableStatistics()
corr = statscm.getStatistic(pcols[0], scols[0], StatisticType.Pearson)
print "Pairwise stats:", pcols[0], scols[0], " Pearson = ", corr