Volver a la versión inglesa de la documentaciónpropiedades de apriorinode
propiedades de apriorinode
Última actualización: 07 oct 2024
El nodo Apriori extrae un conjunto de reglas de los datos y destaca aquellas reglas con un mayor contenido de información. Apriori ofrece cinco métodos diferentes para la selección de reglas y utiliza un sofisticado esquema de indización para procesar eficientemente grandes conjuntos de datos. En los problemas de mucho volumen, Apriori se entrena más rápidamente, no tiene un límite arbitrario para el número de reglas que puede retener y puede gestionar reglas que tengan hasta 32 precondiciones. Apriori requiere que los campos de entrada y salida sean categóricos, pero que ofrezca un mejor rendimiento porque se ha optimizado para este tipo de datos.
Ejemplo
node = stream.create("apriori", "My node")
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("partition", "Test")
# For non-transactional
node.setPropertyValue("use_transactional_data", False)
node.setPropertyValue("consequents", ["Age"])
node.setPropertyValue("antecedents", ["BP", "Cholesterol", "Drug"])
# For transactional
node.setPropertyValue("use_transactional_data", True)
node.setPropertyValue("id_field", "Age")
node.setPropertyValue("contiguous", True)
node.setPropertyValue("content_field", "Drug")
# "Model" tab
node.setPropertyValue("use_model_name", False)
node.setPropertyValue("model_name", "Apriori_bp_choles_drug")
node.setPropertyValue("min_supp", 7.0)
node.setPropertyValue("min_conf", 30.0)
node.setPropertyValue("max_antecedents", 7)
node.setPropertyValue("true_flags", False)
node.setPropertyValue("optimize", "Memory")
# "Expert" tab
node.setPropertyValue("mode", "Expert")
node.setPropertyValue("evaluation", "ConfidenceRatio")
node.setPropertyValue("lower_bound", 7)
Propiedades de apriorinode |
Valores | Descripción de la propiedad |
---|---|---|
consequents |
campo | Los modelos Apriori utilizan Consecuentes y Antecedentes en lugar de los campos estándar objetivo y de entrada. Los campos de ponderación y frecuencia no se usan. Consulte Propiedades comunes del nodo de modelado para obtener más información. |
antecedents |
[field1 ... fieldN] | |
min_supp |
número | |
min_conf |
número | |
max_antecedents |
número | |
true_flags |
distintivo | |
optimize |
Speed Memory |
|
use_transactional_data |
distintivo | |
contiguous |
distintivo | |
id_field |
serie | |
content_field |
serie | |
mode |
Simple Expert |
|
evaluation |
RuleConfidence DifferenceToPrior ConfidenceRatio InformationDifference NormalizedChiSquare |
|
lower_bound |
número | |
optimize |
Speed Memory |
Se utiliza para especificar si la generación del modelo se debe optimizar para la velocidad o la memoria. |
rules_without_antececents |
Boolean | Seleccione esta opción para permitir las reglas que sólo incluyen el consecuente (elemento o conjunto de elementos). Esto resulta de utilidad para determinar elementos o conjuntos de elementos comunes. Por ejemplo, cannedveg es una regla de un solo elemento sin un antecedente que indica que la compra de cannedveg es una aparición común en los datos. |