0 / 0
Torna alla versione inglese della documentazione
Panoramica di AutoAI
Ultimo aggiornamento: 15 nov 2024
Panoramica di AutoAI

Lo strumento grafico AutoAI analizza i dati e utilizza algoritmi di dati, trasformazioni e impostazioni di parametri per creare il miglior modello predittivo. AutoAI visualizza vari modelli potenziali come pipeline di candidati del modello e li classifica in una classifica tra cui scegliere.

Credenziali richieste
Credenziali dell'attività
Formato dei dati
Tabella: file CSV, con delimitatore virgola (,) per tutti i tipi di esperimenti AutoAI .
Dati collegati da IBM Cloud Object Storage.
Dimensione dati
Fino a 1 GB o fino a 20 GB. Per i dettagli, consultare AutoAI data use.

utilizzo dei dati AutoAI

I dati di addestramento e i dati di input del modello sono in formato tabulare. I nomi delle colonne nella tabella devono essere univoci. I nomi colonna duplicati provocherà un errore.

Questi limiti sono basati sulla configurazione di calcolo predefinita di 8 CPU e 32 GB.

Esperimenti di classificazione e regressione AutoAI :

  • È possibile caricare un file fino a 1 GB per gli esperimenti AutoAI .
  • Se ci si connette a un'origine dati che supera 1 GB, vengono utilizzati solo i primi 1 GB di record.

Esperimenti di serie temporali AutoAI :

  • Se l'origine dati contiene una colonna data / ora, AutoAI esegue il campionamento dei dati ad una frequenza uniforme. Ad esempio, i dati possono essere in incrementi di un minuto, un'ora o un giorno. La data / ora specificata viene utilizzata per determinare la finestra di lookback per migliorare la precisione del modello.

    Nota:

    Se la dimensione del file è maggiore di 1 GB, AutoAi ordina i dati in ordine di tempo discendente e solo i primi 1 GB vengono utilizzati per preparare l'esperimento.

  • Se l'origine dati non contiene una colonna data / ora, assicurarsi che AutoAI campiona i dati a intervalli uniformi e ordina i dati in ordine crescente . Un criterio di ordinamento ascendente indica che il valore nella prima riga è il più vecchio e il valore nell'ultima riga è il più recente.

    Nota: se la dimensione del file è maggiore di 1 GB, troncare la dimensione del file in modo che sia minore di 1 GB.

Processo AutoAI

Grazie ad AutoAI, è possibile costruire e distribuire un modello di apprendimento automatico con funzioni di addestramento sofisticate e senza bisogno di codifica. Lo strumento fa la maggior parte del lavoro per voi.

Per visualizzare il codice che ha creato un particolare esperimento o per interagire con l'esperimento in modo programmatico, è possibile salvare un esperimento come un notebook.

Il processo AutoAI prende i dati da un file strutturato, prepara i dati, seleziona il tipo di modello e genera e classifica le pipeline in modo da salvare e distribuire un modello.

AutoAI esegue automaticamente le seguenti attività per creare e valutare le pipeline del modello candidato:

Comprensione del processo AutoAI

Per ulteriori dettagli su ciascuna di queste fasi, inclusi i link ai documenti di ricerca associati e le descrizioni degli algoritmi applicati per creare le pipeline del modello, vedi Dettagli sull'implementazione diAutoAI.

Pre - elaborazione dati

La maggior parte dei dataset contiene diversi formati di dati e valori mancanti, ma gli algoritmi di machine learning standard funzionano solo con numeri e senza valori mancanti. Pertanto, AutoAI applica vari algoritmi o stimatori per analizzare, ripulire e preparare i dati non elaborati per il machine learning. Questa tecnica rileva e categorizza automaticamente i valori in base alle funzioni, ad esempio il tipo di dati: categoriale o numerico. A seconda delle categorie, AutoAI utilizza l' ottimizzazione iper - parametro per determinare la migliore combinazione di strategie per l'assegnazione dei valori mancanti, la codifica delle funzioni e la scalabilità delle funzioni per i tuoi dati.

Selezione modello automatizzata

AutoAI utilizza la selezione automatica dei modelli per identificare il modello migliore per i propri dati. Questo nuovo approccio verifica i modelli potenziali rispetto a piccoli sottoinsiemi di dati e li classifica in base all'accuratezza. AutoAI seleziona quindi i modelli più promettenti e aumenta la dimensione del sottoinsieme di dati finché non identifica la migliore corrispondenza. Questo approccio consente di risparmiare tempo e migliorare le prestazioni riducendo gradualmente i potenziali modelli in base all'accuratezza.

Per informazioni su come gestire le pipeline generate automaticamente per selezionare il modello migliore, fai riferimento a Selezione di un modello AutoAI.

Progettazione di funzioni automatizzata

Feature engineering identifica il modello più accurato trasformando i dati grezzi in una combinazione di funzioni che meglio rappresentano il problema. Questo approccio unico esplora le varie scelte di costruzione delle caratteristiche in modo strutturato e non esaustivo, massimizzando progressivamente la precisione del modello utilizzando l'apprendimento di rinforzo. Questa tecnica determina una sequenza ottimizzata di trasformazioni per i dati che meglio corrispondono agli algoritmi del passo di selezione del modello.

Ottimizzazione degli iperparametri

L'ottimizzazione degli iperparametri perfeziona i modelli più performanti. AutoAI utilizza un nuovo algoritmo di ottimizzazione degli iperparametri per determinate valutazioni di funzioni, come l'addestramento del modello e il calcolo del punteggio, tipiche del machine learning. Questo approccio identifica rapidamente il modello migliore nonostante i lunghi tempi di valutazione ad ogni iterazione.

Passi successivi

Prova l'esercitazione Quick start: crea e distribuisci un modello di machine learning con AutoAI .

Argomento principale Analisi di dati e creazione di modelli

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni