Random Forest© rappresenta un'implementazione avanzata di un algoritmo bagging con un modello struttura ad albero come modello di base.
In random forest, ciascuna struttura ad albero nel suo insieme viene creata da un esempio progettato con delle sostituzioni (ad esempio, un esempio di bootstrap) del set di addestramento. Quando si suddivide un nodo durante la costruzione della struttura ad albero, la suddivisione scelta non sarà più la suddivisione migliore tra tutte le funzioni, bensì sarà quella migliore all'interno di un sottoinsieme casuale di funzioni. Per tale casualità, la distorsione della forest di solito aumenta leggermente (rispetto alla tendenza di una singola struttura non random tree) ma, a causa del calcolo della media, anche la sua varianza diminuisce, solitamente compensando di gran lunga l'aumento della distorsione, quindi generando un modello complessivamente migliore.1
Il nodo Random Forest in 'watsonx.ai Studio è implementato in Python. La palette dei nodi contiene questo nodo e altri nodi Python.
Per ulteriori informazioni sugli algoritmi di strutture ad albero casuali, consultare Foreste di strutture ad albero randomizzate.
1L. Breiman, "Random Forests," Machine Learning, 45(1), 5-32, 2001.