Le noeud Tree-AS est similaire au noeud CHAID ; toutefois, le noeud Tree-AS est conçu pour traiter des données volumineuses afin de créer un arbre unique et affiche le modèle résultant dans le visualiseur de résultats. Le noeud génère un arbre décision à l'aide des statistiques du khi-deux (CHAI) pour identifier les séparations optimales. CHAID peut générer des arbres non binaires, ce qui implique que certaines divisions possèdent plusieurs branches. Les champs cibles et les champs d'entrée peuvent être d'intervalle numérique (continu) ou catégoriques. La méthode Exhaustive CHAID correspond à une modification du CHAID qui examine plus en détail toutes les divisions possibles, mais dont les calculs sont plus longs.
Propriétés treeas |
Valeurs | Description de la propriété |
---|---|---|
target |
Zone | Dans le noeud Tree-AS, les modèles requièrent un seul champ cible et un ou plusieurs champs d'entrée. Un champ de fréquence peut aussi être spécifié. Pour plus d'informations, voir Propriétés communes des noeuds de modélisation . |
method |
chaid exhaustive_chaid |
|
max_depth |
Integer | Profondeur maximale de l'arbren comprise entre 0 et 20. La valeur par défaut est 5. |
num_bins |
Integer | Utilisé uniquement si les données sont constitués d'entrées continues. Définissez le nombre de casiers de fréquence égale à utiliser pour les entrées. Les options possibles sont 2, 4, 5, 10, 20, 25, 50 ou 100. |
record_threshold |
Integer | Nombre d'enregistrements à partir duquel le modèle cesse d'utiliser des valeurs p pour passer aux Tailles d'effet lors de la création de l'arbre. La valeur par défaut est 1 000 000. Augmentez ou diminuez-la par incréments of de 10 000. |
split_alpha |
number | Niveau de signification pour la division. La valeur doit être comprise entre 0.01 et 0.99. |
merge_alpha |
number | Niveau de signification pour la fusion. La valeur doit être comprise entre 0.01 et 0.99. |
bonferroni_adjustment |
option | Ajuster les valeurs de signification à l'aide de la méthode Bonferroni. |
effect_size_threshold_cont |
number | Définit la Taille effet lorsque vous divisez des noeuds et fusionnez des catégories en cas d'utilisation d'une cible continue. La valeur doit être comprise entre 0.01 et 0.99. |
effect_size_threshold_cat |
number | Définit le seuil de la Taille effet lorsque vous divisez des noeuds et fusionnez des catégories en cas d'utilisation d'une cible continue. La valeur doit être comprise entre 0.01 et 0.99. |
split_merged_categories |
option | Autoriser une nouvelle division des catégories fusionnées. |
grouping_sig_level |
number | Détermine la façon dont les groupes de noeuds sont formés ou comment les noeuds inhabituels sont identifiés. |
chi_square |
pearson likelihood_ratio |
Méthode utilisée pour calculer les statistiques du khi-carré : Pearson ou Likelihood Ratio |
minimum_record_use |
use_percentage use_absolute |
|
min_parent_records_pc |
number | La valeur par défaut est 2. Minimum 1, maximum 100, par incréments de 1. La valeur de la branche parent doit être supérieure à la branche enfant. |
min_child_records_pc |
number | La valeur par défaut est 1. Minimum 1, maximum 100, par incréments de 1. |
min_parent_records_abs |
number | La valeur par défaut est 100. Minimum 1, maximum 100, par incréments de 1. La valeur de la branche parent doit être supérieure à la branche enfant. |
min_child_records_abs |
number | La valeur par défaut est 50. Minimum 1, maximum 100, par incréments de 1. |
epsilon |
number | Modification minimale dans les prévisions de fréquence de cellule.. |
max_iterations |
number | Itérations maximales pour convergence. |
use_costs |
option | |
costs |
structuré | Propriétés structurées. Le format est une liste de 3 valeurs : la valeur réelle, la valeur prédite et le coût en cas d'erreur de cette prévision. Par exemple :tree.setPropertyValue("costs", [["drugA", "drugB", 3.0], ["drugX", "drugY",
4.0]]) |
default_cost_increase |
none linear square custom |
Uniquement activé dans les cibles ordinales. Définissez les valeurs par défaut dans la matrice de coût. |
calculate_conf |
option | |
display_rule_id |
option | Ajoute un champ à la sortie de scoring, indiquant l'ID du noeud terminal auquel chaque enregistrement est affecté. |