Lo strumento grafico AutoAI analizza i dati e utilizza algoritmi di dati, trasformazioni e impostazioni di parametri per creare il miglior modello predittivo. AutoAI visualizza vari modelli potenziali come pipeline di candidati del modello e li classifica in una classifica tra cui scegliere.
- Servizio richiesto
- runtime watsonx.ai
- studio watsonx.ai
- Credenziali richieste
- Credenziali dell'attività
- Formato dati
- Tabella: file CSV, con delimitatore virgola (,) per tutti i tipi di esperimenti AutoAI .
- Dati collegati da IBM Cloud Object Storage.
- Dimensione dati
- Fino a 1 GB o fino a 20 GB. Per i dettagli, consultare AutoAI data use.
utilizzo dei dati AutoAI
I dati di addestramento e i dati di input del modello sono in formato tabulare. I nomi delle colonne nella tabella devono essere univoci. I nomi colonna duplicati provocherà un errore.
Questi limiti sono basati sulla configurazione di calcolo predefinita di 8 CPU e 32 GB.
Esperimenti di classificazione e regressione AutoAI :
- È possibile caricare un file fino a 1 GB per gli esperimenti AutoAI .
- Se ci si connette a un'origine dati che supera 1 GB, vengono utilizzati solo i primi 1 GB di record.
Esperimenti di serie temporali AutoAI :
Se l'origine dati contiene una colonna data / ora, AutoAI esegue il campionamento dei dati ad una frequenza uniforme. Ad esempio, i dati possono essere in incrementi di un minuto, un'ora o un giorno. La data / ora specificata viene utilizzata per determinare la finestra di lookback per migliorare la precisione del modello.
Nota:Se la dimensione del file è maggiore di 1 GB, AutoAi ordina i dati in ordine di tempo discendente e solo i primi 1 GB vengono utilizzati per preparare l'esperimento.
Se l'origine dati non contiene una colonna data / ora, assicurarsi che AutoAI campiona i dati a intervalli uniformi e ordina i dati in ordine crescente . Un criterio di ordinamento ascendente indica che il valore nella prima riga è il più vecchio e il valore nell'ultima riga è il più recente.
Nota: se la dimensione del file è maggiore di 1 GB, troncare la dimensione del file in modo che sia minore di 1 GB.
Per ulteriori informazioni sulla scelta dello strumento giusto per i tuoi dati e il tuo caso d'uso, fai riferimento a Scelta di uno strumento.
Processo AutoAI
Utilizzando AutoAI, è possibile costruire e distribuire un modello di apprendimento automatico con sofisticate funzioni di addestramento e senza bisogno di codifica. Lo strumento fa la maggior parte del lavoro per voi.
Per visualizzare il codice che ha creato un particolare esperimento o per interagire con l'esperimento in modo programmatico, è possibile salvare un esperimento come un notebook.
AutoAI esegue automaticamente le seguenti attività per creare e valutare le pipeline del modello candidato:
- Pre - elaborazione dati
- Selezione automatica del modello
- Progettazione di funzioni automatiche
- Ottimizzazione iperparametro
Comprensione del processo AutoAI
Per ulteriori dettagli su ciascuna di queste fasi, inclusi i link ai documenti di ricerca associati e le descrizioni degli algoritmi applicati per creare le pipeline del modello, vedi Dettagli sull'implementazione diAutoAI.
Pre - elaborazione dati
La maggior parte dei dataset contiene diversi formati di dati e valori mancanti, ma gli algoritmi di machine learning standard funzionano solo con numeri e senza valori mancanti. Pertanto, AutoAI applica vari algoritmi o stimatori per analizzare, ripulire e preparare i dati non elaborati per il machine learning. Questa tecnica rileva e categorizza automaticamente i valori in base alle funzioni, ad esempio il tipo di dati: categoriale o numerico. A seconda delle categorie, AutoAI utilizza l' ottimizzazione iper - parametro per determinare la migliore combinazione di strategie per l'assegnazione dei valori mancanti, la codifica delle funzioni e la scalabilità delle funzioni per i tuoi dati.
Selezione modello automatizzata
AutoAI utilizza la selezione automatica dei modelli per identificare il modello migliore per i propri dati. Questo nuovo approccio verifica i modelli potenziali rispetto a piccoli sottoinsiemi di dati e li classifica in base all'accuratezza. AutoAI seleziona quindi i modelli più promettenti e aumenta la dimensione del sottoinsieme di dati finché non identifica la migliore corrispondenza. Questo approccio consente di risparmiare tempo e migliorare le prestazioni riducendo gradualmente i potenziali modelli in base all'accuratezza.
Per informazioni su come gestire le pipeline generate automaticamente per selezionare il modello migliore, fai riferimento a Selezione di un modello AutoAI.
Progettazione di funzioni automatizzata
Feature engineering identifica il modello più accurato trasformando i dati grezzi in una combinazione di funzioni che meglio rappresentano il problema. Questo approccio unico esplora le varie scelte di costruzione delle caratteristiche in modo strutturato e non esaustivo, massimizzando progressivamente la precisione del modello utilizzando l'apprendimento di rinforzo. Questa tecnica determina una sequenza ottimizzata di trasformazioni per i dati che meglio corrispondono agli algoritmi del passo di selezione del modello.
Ottimizzazione iperparametro
L'ottimizzazione degli iperparametri perfeziona i modelli più performanti. AutoAI utilizza un nuovo algoritmo di ottimizzazione degli iperparametri per determinate valutazioni di funzioni, come l'addestramento del modello e il calcolo del punteggio, tipiche del machine learning. Questo approccio identifica rapidamente il modello migliore nonostante i lunghi tempi di valutazione ad ogni iterazione.
Passi successivi
Prova l'esercitazione Quick start: crea e distribuisci un modello di machine learning con AutoAI .
Argomento principale Analisi di dati e creazione di modelli