propriétés de cartnode | IBM Cloud Pak for Data as a Service

Retourner à la version anglaise de la documentation

propriétés de cartnode

Dernière mise à jour : 07 oct. 2024

propriétés de cartnode

Icône du noeud Arbre C & RT Le noeud Arbre Classification et Regression (C&RT) génère un arbre de décisions qui vous permet de prévoir ou de classifier les observations futures. La méthode utilise la technique de partition récursive afin de diviser les données d'apprentissage en segments en réduisant l'index d'impureté à chaque étape, un noeud de l'arbre étant considéré comme "pur" si 100 % de ses observations appartiennent à une catégorie spécifique du champ cible. Les champs cible et les champs d'entrée peuvent être des champs d'intervalle numériques ou des champs catégoriels numériques (nominal,ordinal ou indicateur). Toutes les divisions sont binaires (deux sous-groupes uniquement).

Exemple

node = stream.createAt("cart", "My node", 200, 100)
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("target", "Drug")
node.setPropertyValue("inputs", ["Age", "BP", "Cholesterol"])
# "Build Options" tab, "Objective" panel
node.setPropertyValue("model_output_type", "InteractiveBuilder")
node.setPropertyValue("use_tree_directives", True)
node.setPropertyValue("tree_directives", """Grow Node Index 0 Children 1 2
Grow Node Index 2 Children 3 4""")
# "Build Options" tab, "Basics" panel
node.setPropertyValue("prune_tree", False)
node.setPropertyValue("use_std_err_rule", True)
node.setPropertyValue("std_err_multiplier", 3.0)
node.setPropertyValue("max_surrogates", 7)
# "Build Options" tab, "Stopping Rules" panel
node.setPropertyValue("use_percentage", True)
node.setPropertyValue("min_parent_records_pc", 5)
node.setPropertyValue("min_child_records_pc", 3)
# "Build Options" tab, "Advanced" panel
node.setPropertyValue("min_impurity", 0.0003)
node.setPropertyValue("impurity_measure", "Twoing")
# "Model Options" tab
node.setPropertyValue("use_model_name", True)
node.setPropertyValue("model_name", "Cart_Drug")

Tableau 1. propriétés de cartnode
Propriétés `cartnode`	Valeurs	Description de la propriété
`target`	Zone	Les modèles d'arbre C&R requièrent un seul champ cible et un ou plusieurs champs d'entrée. Un champ de fréquence peut aussi être spécifié. Pour plus d'informations, voir la rubrique Propriétés de noeud de modélisation communes .
`continue_training_existing_model`	option
`objective`	`Standard` `Boosting` `Bagging` `psm`	`psm` est utilisé pour les ensembles de données très volumineux et nécessite une connexion au serveur.
`model_output_type`	`Single` `InteractiveBuilder`
`use_tree_directives`	option
`tree_directives`	chaîne	Définissez les directives de développement de l'arbre. Vous pouvez placer les directives entre guillemets triples pour ne pas tenir compte des caractères d'insertion de ligne ou des guillemets doubles. Notez que les directives sont parfois très sensibles aux modifications, même mineures, apportées aux données ou aux options de modélisation. Elles peuvent ne pas s'étendre aux autres jeux de données.
`use_max_depth`	`Default` `Custom`
`max_depth`	Integer	Profondeur maximale de l'arbre, de 0 à 1000. Utilisé uniquement si `use_max_depth = Custom`.
`prune_tree`	option	Elagage de l'arbre pour éviter le surajustement.
`use_std_err`	option	Utiliser la différence maximale pour le risque (dans Erreurs standard).
`std_err_multiplier`	number	Différence maximale.
`max_surrogates`	number	Nombre maximal de substitutions.
`use_percentage`	option
`min_parent_records_pc`	number
`min_child_records_pc`	number
`min_parent_records_abs`	number
`min_child_records_abs`	number
`use_costs`	option
`costs`	structuré	Propriétés structurées.
`priors`	`Data` `Equal` `Custom`
`custom_priors`	structuré	Propriétés structurées.
`adjust_priors`	option
`trails`	number	Nombre des modèles de composant pour le boosting ou le bagging.
`set_ensemble_method`	`Voting` `HighestProbability` `HighestMeanProbability`	Règles de combinaison par défaut pour les cibles catégorielles.
`range_ensemble_method`	`Mean` `Median`	Règles de combinaison par défaut pour les cibles continues.
`large_boost`	option	Appliquer le boosting aux jeux de données très volumineux.
`min_impurity`	number
`impurity_measure`	`Gini` `Twoing` `Ordered`
`train_pct`	number	Ensemble de prévention de surajustement.
`set_random_seed`	option	Dupliquer l'option des résultats.
`seed`	number
`calculate_variable_importance`	option
`calculate_raw_propensities`	option
`calculate_adjusted_propensities`	option
`adjusted_propensity_partition`	`Test` `Validation`