영어 버전 문서로 돌아가기apriorinode 특성
apriorinode 특성
마지막 업데이트 날짜: 2024년 10월 07일
Apriori 노드는 데이터에서 규칙 세트를 추출하고 정보 내용이 가장 많은 규칙을 꺼냅니다. Apriori는 규칙을 선택하는 5개의 서로 다른 방법을 제공하며 정교한 색인화 스킴을 사용하여 대형 데이터 세트를 효율적으로 처리합니다. 큰 문제점의 경우, Apriori는 일반적으로 훈련 속도가 빠릅니다. 보유할 수 있는 규칙 수에 임의 제한이 없으며 최대 32개의 전제조건을 가진 규칙을 처리할 수 있습니다. 아프리모리는 입력 및 출력 필드가 모두 범주형이어야 하지만 이러한 유형의 데이터에 대해 최적화되어 있기 때문에 보다 나은 성능을 제공해야 합니다.
예
node = stream.create("apriori", "My node")
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("partition", "Test")
# For non-transactional
node.setPropertyValue("use_transactional_data", False)
node.setPropertyValue("consequents", ["Age"])
node.setPropertyValue("antecedents", ["BP", "Cholesterol", "Drug"])
# For transactional
node.setPropertyValue("use_transactional_data", True)
node.setPropertyValue("id_field", "Age")
node.setPropertyValue("contiguous", True)
node.setPropertyValue("content_field", "Drug")
# "Model" tab
node.setPropertyValue("use_model_name", False)
node.setPropertyValue("model_name", "Apriori_bp_choles_drug")
node.setPropertyValue("min_supp", 7.0)
node.setPropertyValue("min_conf", 30.0)
node.setPropertyValue("max_antecedents", 7)
node.setPropertyValue("true_flags", False)
node.setPropertyValue("optimize", "Memory")
# "Expert" tab
node.setPropertyValue("mode", "Expert")
node.setPropertyValue("evaluation", "ConfidenceRatio")
node.setPropertyValue("lower_bound", 7)
apriorinode 특성 |
값 | 특성 설명 |
---|---|---|
consequents |
필드 | Apriori 모델은 표준 대상 및 입력 필드 대신 후항값(Consequents) 및 전항(Antecedents)을 사용합니다. 가중치 및 빈도 필드는 사용하지 않습니다. 자세한 정보는 공통 모델링 노드 특성 을 참조하십시오. |
antecedents |
[field1 ... fieldN] | |
min_supp |
Number | |
min_conf |
Number | |
max_antecedents |
Number | |
true_flags |
플래그 | |
optimize |
Speed Memory |
|
use_transactional_data |
플래그 | |
contiguous |
플래그 | |
id_field |
문자열 | |
content_field |
문자열 | |
mode |
Simple Expert |
|
evaluation |
RuleConfidence DifferenceToPrior ConfidenceRatio InformationDifference NormalizedChiSquare |
|
lower_bound |
Number | |
optimize |
Speed Memory |
모델 작성이 속도 또는 메모리에 대해 최적화되어야 하는지 여부를 지정하는 데 사용합니다. |
rules_without_antececents |
부울 | 후항(항목 또는 항목 세트)만 포함한 규칙을 허용하려면 이 옵션을
선택하십시오. 이 옵션은 공통 항목 또는 항목 세트
판별에 관심이 있는 경우에 유용합니다. 예를 들어, cannedveg 은(는) cannedveg 구매가 데이터에서 일반적인 발생임을 표시하는 전항이 없는 단일 항목 규칙입니다. |