0 / 0
Torna alla versione inglese della documentazione
Nodo CHAID
Ultimo aggiornamento: 23 mag 2024
nodo CHAID (SPSS Modeler)

CHAID, acronimo di Chi-squared Automatic Interaction Detection, è un metodo di classificazione per la creazione di strutture ad albero delle decisioni basato sull'utilizzo di statistiche chi-quadrato per identificare suddivisioni ottimali.

CHAID esamina innanzitutto le tavole di contingenza tra ciascun campo di input e il risultato e verifica la significatività utilizzando un test di indipendenza chi - quadrato. Se più di una di queste relazioni è statisticamente significativa, CHAID seleziona il campo di input più significativo (valore p più piccolo). Se un input ha più di due categorie, vengono confrontate. Le categorie che non mostrano differenze nel risultato vengono compresse insieme. L'unione delle categorie viene eseguita unendo successivamente la coppia di categorie che mostrano la differenza meno significativa. Il processo di unione delle categorie si interrompe quando la differenza tra tutte le categorie rimanenti è uguale a quella specificata dal test. Per i campi di input nominali è possibile unire qualsiasi categoria, mentre per gli insiemi ordinali è possibile unire solo le categorie contigue.

Exhaustive CHAID è una modifica di CHAID che esegue operazioni avanzate per l'analisi di tutte le suddivisioni possibili per ogni predittore, ma richiede tempi di elaborazione maggiori.

Requisiti

I campi obiettivo e di input possono essere continui o categoriali. I nodi possono essere suddivisi in due o più sottogruppi a ciascun livello. Tutti i campi ordinali utilizzati nel modello devono avere un'archiviazione numerica (non una stringa). Se necessario, è possibile utilizzare il nodo Ricodifica per convertirli.

Punti di forza

A differenza dei nodi C & R Tree e QUEST, CHAID può generare strutture ad albero non binarie, il che significa che alcune suddivisioni hanno più di due rami. Per questo motivo, CHAID tende a creare una struttura ad albero più ampia rispetto ai metodi di crescita binari. CHAID è applicabile a tutti i tipi di input e accetta sia i pesi di caso sia le variabili di frequenza.

Livelli personalizzati

È possibile personalizzare le proprietà del nodo CHAID per specificare i campi che l'algoritmo CHAID deve utilizzare quando determina dove suddividere la struttura ad albero delle decisioni. Quando viene eseguito il flusso SPSS Modeler , l'albero decisionale utilizza il campo specificato per tale livello quando viene diviso. È possibile specificare campi per più livelli per controllare ogni suddivisione dell'albero decisionale.

È possibile utilizzare livelli personalizzati per controllare la crescita della struttura ad albero delle decisioni. Questo controllo è particolarmente utile quando si conosce bene il dataset o si dispone di alcune regole decisionali predefinite.

Per utilizzare i livelli personalizzati, è necessario abilitarli e configurarli:
  1. Nelle proprietà del nodo CHAID, espandere Opzioni Modeler.
  2. Fare clic sulla casella di spunta Personalizza livelli e fare clic su Aggiungi valore.
  3. Fare clic sulla riga e selezionare il nome di un campo dall'elenco.
  4. Fare clic su Aggiungi valore per aggiungere più righe alla tabella Livelli personalizzati .
Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni