0 / 0
영어 버전 문서로 돌아가기
열 통계 컨텐츠 모델 및 대응별 통계 컨텐츠 모델
마지막 업데이트 날짜: 2024년 10월 07일
열 통계 컨텐츠 모델 및 대응별 통계 컨텐츠 모델

컬럼 통계 컨텐츠 모델은 각 필드(일변량 통계)에 대해 계산할 수 있는 통계에 대한 액세스를 제공합니다. 쌍별 통계 컨텐츠 모델은 필드의 쌍 또는 필드의 값 사이에서 계산할 수 있는 통계에 대한 액세스를 제공합니다.

다음과 같은 통계 수치를 사용할 수 있습니다.

  • Count
  • UniqueCount
  • ValidCount
  • Mean
  • Sum
  • Min
  • Max
  • Range
  • Variance
  • StandardDeviation
  • StandardErrorOfMean
  • Skewness
  • SkewnessStandardError
  • Kurtosis
  • KurtosisStandardError
  • Median
  • Mode
  • Pearson
  • Covariance
  • TTest
  • FTest

일부 값은 단일 열 통계량에서만 적합한 반면 다른 값은 대응별 통계량에 대해서만 적합합니다.

이를 생성하는 노드는 다음과 같습니다.

  • 통계량 노드는 열 통계량을 생성하며 상관관계 필드가 지정될 때 대응별 통계량을 생성할 수 있습니다.
  • 데이터 검토 노드는 열을 생성하고 오버레이 필드가 지정될 때 대응별 통계량을 생성할 수 있습니다.
  • 평균 노드는 필드 쌍을 비교할 때 또는 필드의 값을 다른 필드 요약값과 비교할 때 대응별 통계량을 생성합니다.

사용 가능한 컨텐츠 모델 및 통계는 특정 노드의 기능 및 노드 내의 설정 모두에 따라 다릅니다.

표 1. 컬럼 통계 컨텐츠 모델의 메소드
방법 리턴 유형 설명
getAvailableStatistics() List<StatisticType> 이 모델의 사용 가능 통계량을 리턴합니다. 모든 필드에 모든 통계에 대한 값이 반드시 있는 것은 아닙니다.
getAvailableColumns() List<String> 통계량이 계산되는 열 이름을 리턴합니다.
getStatistic(String column, StatisticType statistic) Number 열과 연관된 통계 값을 리턴합니다.
reset() void 이 컨텐츠 모델과 연관된 모든 내부 저장 공간을 비웁니다.
표 2. 페어와이즈 통계 컨텐츠 모델에 대한 메소드
방법 리턴 유형 설명
getAvailableStatistics() List<StatisticType> 이 모델의 사용 가능 통계량을 리턴합니다. 모든 필드에 모든 통계에 대한 값이 반드시 있는 것은 아닙니다.
getAvailablePrimaryColumns() List<String> 통계량이 계산된 1차 열 이름을 리턴합니다.
getAvailablePrimaryValues() List<Object> 통계량이 계산된 1차 열의 값을 리턴합니다.
getAvailableSecondaryColumns() List<String> 통계량이 계산된 2차 열 이름을 리턴합니다.
getStatistic(String primaryColumn, String secondaryColumn, StatisticType statistic) Number 열과 연관된 통계 값을 리턴합니다.
getStatistic(String primaryColumn, Object primaryValue, String secondaryColumn, StatisticType statistic) Number 1차 열 값 및 2차 열과 연관된 통계 값을 리턴합니다.
reset() void 이 컨텐츠 모델과 연관된 모든 내부 저장 공간을 비웁니다.

노드와 출력

이 테이블은 이 유형의 컨텐츠 모델을 포함하는 출력을 빌드하는 노드를 나열합니다.

표 3. 노드와 출력
노드 이름 출력 이름 컨테이너 ID 참고:
"means" (평균 노드) "means" "columnStatistics"  
"means" (평균 노드) "means" "pairwiseStatistics"  
"dataaudit" (데이터 검토 노드) "means" "columnStatistics"  
"statistics" (통계량 노드) "statistics" "columnStatistics" 특정 필드가 검사될 때만 생성됩니다.
"statistics" (통계량 노드) "statistics" "pairwiseStatistics" 필드가 상관분석될 때만 생성됩니다.

예제 스크립트

from modeler.api import StatisticType
stream = modeler.script.stream()

# Set up the input data
varfile = stream.createAt("variablefile", "File", 96, 96)
varfile.setPropertyValue("full_filename", "$CLEO/DEMOS/DRUG1n")

# Now create the statistics node. This can produce both
# column statistics and pairwise statistics
statisticsnode = stream.createAt("statistics", "Stats", 192, 96)
statisticsnode.setPropertyValue("examine", ["Age", "Na", "K"])
statisticsnode.setPropertyValue("correlate", ["Age", "Na", "K"])
stream.link(varfile, statisticsnode)

results = []
statisticsnode.run(results)
statsoutput = results[0]
statscm = statsoutput.getContentModel("columnStatistics")
if (statscm != None):
	cols = statscm.getAvailableColumns()
	stats = statscm.getAvailableStatistics()
	print "Column stats:", cols[0], str(stats[0]), " = ", statscm.getStatistic(cols[0], stats[0])

statscm = statsoutput.getContentModel("pairwiseStatistics")
if (statscm != None):
	pcols = statscm.getAvailablePrimaryColumns()
	scols = statscm.getAvailableSecondaryColumns()
	stats = statscm.getAvailableStatistics()
	corr = statscm.getStatistic(pcols[0], scols[0], StatisticType.Pearson)
	print "Pairwise stats:", pcols[0], scols[0], " Pearson = ", corr

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기