À propos des cookies sur ce site Pour fonctionner correctement, nos sites Internet nécessitent certains cookies (requis). En outre, d'autres cookies peuvent être utilisés avec votre consentement pour analyser l'utilisation d'un site, améliorer l'expérience des utilisateurs et à des fins publicitaires. Pour plus informations, passez en revue vos options de préférences en. En visitant notre site Web, vous acceptez que nous traitions les informations comme décrit dans ladéclaration de confidentialité d’IBM. Pour faciliter la navigation, vos préférences en matière de cookie seront partagées dans les domaines Web d'IBM énumérés ici.
propriétés de cartnode
Dernière mise à jour : 11 févr. 2025
Le noeud Arbre Classification et Regression (C&RT) génère un arbre de décisions qui vous permet de prévoir ou de classifier les observations futures. La méthode utilise la technique de partition récursive afin de diviser les données d'apprentissage en segments en réduisant l'index d'impureté à chaque étape, un noeud de l'arbre étant considéré comme "pur" si 100 % de ses observations appartiennent à une catégorie spécifique du champ cible. Les champs cible et les champs d'entrée peuvent être des champs d'intervalle numériques ou des champs catégoriels numériques (nominal,ordinal ou indicateur). Toutes les divisions sont binaires (deux sous-groupes uniquement).
Exemple
node = stream.createAt("cart", "My node", 200, 100)
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("target", "Drug")
node.setPropertyValue("inputs", ["Age", "BP", "Cholesterol"])
# "Build Options" tab, "Objective" panel
node.setPropertyValue("model_output_type", "InteractiveBuilder")
node.setPropertyValue("use_tree_directives", True)
node.setPropertyValue("tree_directives", """Grow Node Index 0 Children 1 2
Grow Node Index 2 Children 3 4""")
# "Build Options" tab, "Basics" panel
node.setPropertyValue("prune_tree", False)
node.setPropertyValue("use_std_err_rule", True)
node.setPropertyValue("std_err_multiplier", 3.0)
node.setPropertyValue("max_surrogates", 7)
# "Build Options" tab, "Stopping Rules" panel
node.setPropertyValue("use_percentage", True)
node.setPropertyValue("min_parent_records_pc", 5)
node.setPropertyValue("min_child_records_pc", 3)
# "Build Options" tab, "Advanced" panel
node.setPropertyValue("min_impurity", 0.0003)
node.setPropertyValue("impurity_measure", "Twoing")
# "Model Options" tab
node.setPropertyValue("use_model_name", True)
node.setPropertyValue("model_name", "Cart_Drug")
Propriétés
|
Valeurs | Description de la propriété |
---|---|---|
|
Zone | Les modèles d'arbre C&R requièrent un seul champ cible et un ou plusieurs champs d'entrée. Un champ de fréquence peut aussi être spécifié. Pour plus d'informations, voir la rubrique Propriétés de noeud de modélisation communes . |
|
option | |
|
|
est utilisé pour les ensembles de données très volumineux et nécessite une connexion au serveur. |
|
|
|
|
option | |
|
chaîne | Définissez les directives de développement de l'arbre. Vous pouvez placer les directives entre guillemets triples pour ne pas tenir compte des caractères d'insertion de ligne ou des guillemets doubles. Notez que les directives sont parfois très sensibles aux modifications, même mineures, apportées aux données ou aux options de modélisation. Elles peuvent ne pas s'étendre aux autres jeux de données. |
|
|
|
|
Integer | Profondeur maximale de l'arbre, de 0 à 1000. Utilisé uniquement si . |
|
option | Elagage de l'arbre pour éviter le surajustement. |
|
option | Utiliser la différence maximale pour le risque (dans Erreurs standard). |
|
number | Différence maximale. |
|
number | Nombre maximal de substitutions. |
|
option | |
|
number | |
|
number | |
|
number | |
|
number | |
|
option | |
|
structuré | Propriétés structurées. |
|
|
|
|
structuré | Propriétés structurées. |
|
option | |
|
number | Nombre des modèles de composant pour le boosting ou le bagging. |
|
|
Règles de combinaison par défaut pour les cibles catégorielles. |
|
|
Règles de combinaison par défaut pour les cibles continues. |
|
option | Appliquer le boosting aux jeux de données très volumineux. |
|
number | |
|
|
|
|
number | Ensemble de prévention de surajustement. |
|
option | Dupliquer l'option des résultats. |
|
number | |
|
option | |
|
option | |
|
option | |
|
|
La rubrique a-t-elle été utile ?
0/1000