영어 버전 문서로 돌아가기열 통계 컨텐츠 모델 및 대응별 통계 컨텐츠 모델
열 통계 컨텐츠 모델 및 대응별 통계 컨텐츠 모델
마지막 업데이트 날짜: 2024년 10월 07일
컬럼 통계 컨텐츠 모델은 각 필드(일변량 통계)에 대해 계산할 수 있는 통계에 대한 액세스를 제공합니다. 쌍별 통계 컨텐츠 모델은 필드의 쌍 또는 필드의 값 사이에서 계산할 수 있는 통계에 대한 액세스를 제공합니다.
다음과 같은 통계 수치를 사용할 수 있습니다.
Count
UniqueCount
ValidCount
Mean
Sum
Min
Max
Range
Variance
StandardDeviation
StandardErrorOfMean
Skewness
SkewnessStandardError
Kurtosis
KurtosisStandardError
Median
Mode
Pearson
Covariance
TTest
FTest
일부 값은 단일 열 통계량에서만 적합한 반면 다른 값은 대응별 통계량에 대해서만 적합합니다.
이를 생성하는 노드는 다음과 같습니다.
- 통계량 노드는 열 통계량을 생성하며 상관관계 필드가 지정될 때 대응별 통계량을 생성할 수 있습니다.
- 데이터 검토 노드는 열을 생성하고 오버레이 필드가 지정될 때 대응별 통계량을 생성할 수 있습니다.
- 평균 노드는 필드 쌍을 비교할 때 또는 필드의 값을 다른 필드 요약값과 비교할 때 대응별 통계량을 생성합니다.
사용 가능한 컨텐츠 모델 및 통계는 특정 노드의 기능 및 노드 내의 설정 모두에 따라 다릅니다.
방법 | 리턴 유형 | 설명 |
---|---|---|
getAvailableStatistics() |
List<StatisticType> |
이 모델의 사용 가능 통계량을 리턴합니다. 모든 필드에 모든 통계에 대한 값이 반드시 있는 것은 아닙니다. |
getAvailableColumns() |
List<String> |
통계량이 계산되는 열 이름을 리턴합니다. |
getStatistic(String column, StatisticType statistic) |
Number |
열과 연관된 통계 값을 리턴합니다. |
reset() |
void |
이 컨텐츠 모델과 연관된 모든 내부 저장 공간을 비웁니다. |
방법 | 리턴 유형 | 설명 |
---|---|---|
getAvailableStatistics() |
List<StatisticType> |
이 모델의 사용 가능 통계량을 리턴합니다. 모든 필드에 모든 통계에 대한 값이 반드시 있는 것은 아닙니다. |
getAvailablePrimaryColumns() |
List<String> |
통계량이 계산된 1차 열 이름을 리턴합니다. |
getAvailablePrimaryValues() |
List<Object> |
통계량이 계산된 1차 열의 값을 리턴합니다. |
getAvailableSecondaryColumns() |
List<String> |
통계량이 계산된 2차 열 이름을 리턴합니다. |
getStatistic(String primaryColumn, String secondaryColumn, StatisticType
statistic) |
Number |
열과 연관된 통계 값을 리턴합니다. |
getStatistic(String primaryColumn, Object primaryValue, String secondaryColumn,
StatisticType statistic) |
Number |
1차 열 값 및 2차 열과 연관된 통계 값을 리턴합니다. |
reset() |
void |
이 컨텐츠 모델과 연관된 모든 내부 저장 공간을 비웁니다. |
노드와 출력
이 테이블은 이 유형의 컨텐츠 모델을 포함하는 출력을 빌드하는 노드를 나열합니다.
노드 이름 | 출력 이름 | 컨테이너 ID | 참고: |
---|---|---|---|
"means" (평균 노드) |
"means" |
"columnStatistics" |
|
"means" (평균 노드) |
"means" |
"pairwiseStatistics" |
|
"dataaudit" (데이터 검토 노드) |
"means" |
"columnStatistics" |
|
"statistics" (통계량 노드) |
"statistics" |
"columnStatistics" |
특정 필드가 검사될 때만 생성됩니다. |
"statistics" (통계량 노드) |
"statistics" |
"pairwiseStatistics" |
필드가 상관분석될 때만 생성됩니다. |
예제 스크립트
from modeler.api import StatisticType
stream = modeler.script.stream()
# Set up the input data
varfile = stream.createAt("variablefile", "File", 96, 96)
varfile.setPropertyValue("full_filename", "$CLEO/DEMOS/DRUG1n")
# Now create the statistics node. This can produce both
# column statistics and pairwise statistics
statisticsnode = stream.createAt("statistics", "Stats", 192, 96)
statisticsnode.setPropertyValue("examine", ["Age", "Na", "K"])
statisticsnode.setPropertyValue("correlate", ["Age", "Na", "K"])
stream.link(varfile, statisticsnode)
results = []
statisticsnode.run(results)
statsoutput = results[0]
statscm = statsoutput.getContentModel("columnStatistics")
if (statscm != None):
cols = statscm.getAvailableColumns()
stats = statscm.getAvailableStatistics()
print "Column stats:", cols[0], str(stats[0]), " = ", statscm.getStatistic(cols[0], stats[0])
statscm = statsoutput.getContentModel("pairwiseStatistics")
if (statscm != None):
pcols = statscm.getAvailablePrimaryColumns()
scols = statscm.getAvailableSecondaryColumns()
stats = statscm.getAvailableStatistics()
corr = statscm.getStatistic(pcols[0], scols[0], StatisticType.Pearson)
print "Pairwise stats:", pcols[0], scols[0], " Pearson = ", corr