資料の 英語版 に戻る列統計コンテンツ モデルおよびペアごとの統計コンテンツ モデル
列統計コンテンツ モデルおよびペアごとの統計コンテンツ モデル
最終更新: 2024年10月04日
列統計コンテンツ・モデルは、各フィールドについて計算できる統計 (1 変量統計) へのアクセスを提供します。 ペアごとの統計コンテンツ・モデル は、フィールドまたはフィールド内の値のペアの間で計算できる統計へのアクセスを提供します。
以下の統計測定のいずれかが可能です。
Count
UniqueCount
ValidCount
Mean
Sum
Min
Max
Range
Variance
StandardDeviation
StandardErrorOfMean
Skewness
SkewnessStandardError
Kurtosis
KurtosisStandardError
Median
Mode
Pearson
Covariance
TTest
FTest
一部の値は単一の列統計の場合のみに該当し、その他の値はペアごとの統計の場合のみに該当します。
これらを生成するノードは、以下のとおりです。
- 記述統計ノード: 列統計を生成し、相関フィールドが指定されている場合はペアごとの統計を生成できます。
- データ検査ノード: 列を生成し、オーバーレイ フィールドが指定されている場合はペアごとの統計を生成できます。
- 平均値ノード: フィールドのペアを比較するとき、またはあるフィールドの値を他のフィールド要約と比較するときに、ペアごとの統計を生成します。
使用可能なコンテンツ・モデルと統計は、特定のノードの機能とノード内の設定の両方によって異なります。
メソッド | 戻りタイプ | 説明 |
---|---|---|
getAvailableStatistics() |
List<StatisticType> |
このモデルで使用可能な統計を返します。 すべてのフィールドに必ずしもすべての統計の値があるとは限りません。 |
getAvailableColumns() |
List<String> |
統計が計算された対象の列名を返します。 |
getStatistic(String column, StatisticType statistic) |
Number |
列に関連付けられた統計値を返します。 |
reset() |
void |
このコンテンツ モデルに関連付けられた内部ストレージをすべて消去します。 |
メソッド | 戻りタイプ | 説明 |
---|---|---|
getAvailableStatistics() |
List<StatisticType> |
このモデルで使用可能な統計を返します。 すべてのフィールドに必ずしもすべての統計の値があるとは限りません。 |
getAvailablePrimaryColumns() |
List<String> |
統計が計算された対象の 1 次列名を返します。 |
getAvailablePrimaryValues() |
List<Object> |
統計が計算された対象の 1 次列の値を返します。 |
getAvailableSecondaryColumns() |
List<String> |
統計が計算された対象の 2 次列名を返します。 |
getStatistic(String primaryColumn, String secondaryColumn, StatisticType
statistic) |
Number |
列に関連付けられた統計値を返します。 |
getStatistic(String primaryColumn, Object primaryValue, String secondaryColumn,
StatisticType statistic) |
Number |
1 次列値と 2 次列に関連付けられた統計値を返します。 |
reset() |
void |
このコンテンツ モデルに関連付けられた内部ストレージをすべて消去します。 |
ノードおよび出力
この表には、このタイプのコンテンツ・モデルを含む出力を作成するノードがリストされています。
ノード名 | 出力名 | コンテナー ID | ノート |
---|---|---|---|
"means" (Means ノード) |
"means" |
"columnStatistics" |
|
"means" (Means ノード) |
"means" |
"pairwiseStatistics" |
|
"dataaudit" (データ検査ノード) |
"means" |
"columnStatistics" |
|
"statistics" (記述統計ノード) |
"statistics" |
"columnStatistics" |
特定のフィールドが検証された場合のみ生成されます。 |
"statistics" (記述統計ノード) |
"statistics" |
"pairwiseStatistics" |
フィールドが相関している場合のみ生成されます。 |
サンプル・スクリプト
from modeler.api import StatisticType
stream = modeler.script.stream()
# Set up the input data
varfile = stream.createAt("variablefile", "File", 96, 96)
varfile.setPropertyValue("full_filename", "$CLEO/DEMOS/DRUG1n")
# Now create the statistics node. This can produce both
# column statistics and pairwise statistics
statisticsnode = stream.createAt("statistics", "Stats", 192, 96)
statisticsnode.setPropertyValue("examine", ["Age", "Na", "K"])
statisticsnode.setPropertyValue("correlate", ["Age", "Na", "K"])
stream.link(varfile, statisticsnode)
results = []
statisticsnode.run(results)
statsoutput = results[0]
statscm = statsoutput.getContentModel("columnStatistics")
if (statscm != None):
cols = statscm.getAvailableColumns()
stats = statscm.getAvailableStatistics()
print "Column stats:", cols[0], str(stats[0]), " = ", statscm.getStatistic(cols[0], stats[0])
statscm = statsoutput.getContentModel("pairwiseStatistics")
if (statscm != None):
pcols = statscm.getAvailablePrimaryColumns()
scols = statscm.getAvailableSecondaryColumns()
stats = statscm.getAvailableStatistics()
corr = statscm.getStatistic(pcols[0], scols[0], StatisticType.Pearson)
print "Pairwise stats:", pcols[0], scols[0], " Pearson = ", corr