Nota: è possibile utilizzare gli stessi dati di addestramento con uno o più esperimenti di ottimizzazione.
Dimensione dati
Da 50 a 10.000 coppie di esempio di input e output. La dimensione massima del file è 200 MB.
Tuning Studio non è disponibile con tutti i piani o in tutti i data center. I modelli di base disponibili per l'ottimizzazione nell' Tuning Studio, inoltre, possono differire a seconda del centro dati. Per ulteriori informazioni, consultare watsonx.ai Piani di esecuzione e disponibilità regionale per servizi e funzionalità.
Prima di iniziare
Copy link to section
In genere, l' Tuning Studio e è disponibile da un progetto creato automaticamente per te quando ti iscrivi a watsonx.ai. Il progetto si chiama sandbox e può essere utilizzato per iniziare a testare e personalizzare i modelli di base.
Se non hai un progetto, creane uno. Dal menu principale, espandi Progetti, quindi fai clic su Tutti i progetti.
Fare clic su Nuovo progetto.
Assegna un nome al progetto e, se lo desideri, aggiungi una descrizione.
Per ulteriori informazioni sulle opzioni del progetto, come la creazione di report o la registrazione, vedere Creazione di un progetto.
Fare clic su Crea.
Prendere decisioni sulle seguenti opzioni di messa a punto:
Crea una serie di esempi di prompt che seguono lo schema che genera i migliori risultati in base al tuo lavoro di ingegneria dei prompt. Vedere Formati dati.
Messa a punto di un modello di fondazione
Copy link to section
Dalla home page di watsonx.ai, scegli il tuo progetto e poi clicca su New asset > Tune a foundation model with labeled data.
Dai un nome all'esperimento di messa a punto.
Opzionale : aggiungere una descrizione e dei tag. Aggiungi una descrizione come promemoria per te stesso e per aiutare i collaboratori a capire l'obiettivo del modello messo a punto. L'assegnazione di un tag ti consente di filtrare in un secondo momento le risorse di ottimizzazione per mostrare solo quelle associate a un tag.
Fare clic su Crea.
Fare clic su Seleziona un modello di fondazione per scegliere il modello di fondazione che si desidera mettere a punto.
Fare clic su un riquadro per visualizzare una scheda del modello con i dettagli sul modello di fondazione. Quando trovi il modello di fondazione che desideri utilizzare, fai clic su Seleziona.
Scegliere come inizializzare il prompt tra le seguenti opzioni:
Testo
Utilizza il testo specificato.
Casuale
Utilizza i valori generati per te come parte dell'esperimento di messa a punto.
Queste opzioni sono correlate al metodo di ottimizzazione rapida per i modelli di ottimizzazione. Per ulteriori informazioni su come ogni opzione influisce sull'esperimento di ottimizzazione, vedere Come funziona l'ottimizzazione rapida.
Obbligatorio solo per il metodo di inizializzazione del testo : aggiungere il testo di inizializzazione che si desidera includere nel prompt.
Per un'attività di classificazione, dare un'istruzione che descriva ciò che si vuole classificare ed elenchi le etichette di classe da utilizzare. Ad esempio, classificare se il sentimento di ogni commento è positivo o negativo.
Per un'attività generativa, descrivi cosa vuoi che il modello fornisca in uscita. Ad esempio, sostenere la possibilità per i dipendenti di lavorare da casa alcuni giorni alla settimana.
Per un compito di sintesi, dare un'istruzione come: Sintetizza i punti principali di una trascrizione di una riunione.
Scegli un tipo di attività.
Scegli il tipo di attività che più si avvicina a ciò che vuoi che faccia il modello:
Classificazione
Prevede le etichette categoriche dalle caratteristiche. Ad esempio, dato un insieme di commenti dei clienti, potresti voler etichettare ogni affermazione come una domanda o un problema. Separando i problemi dei clienti, è possibile individuarli e risolverli più rapidamente. Questo tipo di attività gestisce la classificazione a etichetta singola.
Generazione
Genera testo. Ad esempio, scrive un'e-mail promozionale.
Riepilogo
Genera un testo che descrive le idee principali espresse in un corpo di testo. Ad esempio, riassume un documento di ricerca.
Qualunque sia l'attività scelta, l'input viene inviato al modello di base sottostante come tipo di richiesta generativa durante l'esperimento. Per le attività di classificazione, i nomi delle classi vengono presi in considerazione nei prompt utilizzati per sintonizzare il modello. Con l'evolversi dei modelli e dei metodi di messa a punto, è probabile che vengano aggiunti miglioramenti specifici per le attività, che possono essere sfruttati se le attività sono rappresentate in modo accurato.
Necessario solo per le attività di classificazione : nel campo di output Classificazione, aggiungere le etichette di classe che si desidera utilizzare per il modello, una alla volta.
Importante : specificare le stesse etichette utilizzate nei dati di formazione.
Durante l'esperimento di ottimizzazione, le informazioni sull'etichetta di classe vengono inviate insieme agli esempi di input dai dati di addestramento.
Aggiungere i dati di addestramento che verranno utilizzati per mettere a punto il modello. Puoi caricare un file o utilizzare una risorsa dal tuo progetto.
Per vedere esempi di come formattare il file, espandi Come dovrebbero apparire i tuoi dati?, e poi fare clic su Anteprima modello. È possibile copiare o scaricare uno dei modelli di dati da compilare con i propri dati.
Opzionale : se si desidera limitare la dimensione degli esempi di input o output utilizzati durante la formazione, regolare il numero massimo di token consentiti.
Espandi Come dovrebbero essere i tuoi dati?, e poi scorrere per visualizzare i campi Numero massimo di token di input e Numero massimo di token di output. Trascinare i cursori per modificare i valori. Limitare le dimensioni può ridurre il tempo necessario per eseguire l'esperimento di ottimizzazione. Per ulteriori informazioni, vedere Controllo del numero di gettoni utilizzati.
Opzionale : fare clic su Configura parametri per modificare i parametri utilizzati dall'esperimento di ottimizzazione.
La corsa di messa a punto è configurata con valori di parametri che rappresentano un buon punto di partenza per la messa a punto di un modello. Se vuoi, puoi regolarli.
Per ulteriori informazioni sui parametri disponibili e sul loro funzionamento, vedere Parametri di regolazione.
Dopo aver modificato i valori dei parametri, fare clic su Salva.
Fare clic su Avvia sintonizzazione.
Inizia l'esperimento di messa a punto. Potrebbero essere necessari da pochi minuti a qualche ora, a seconda della dimensione dei dati di formazione e della disponibilità di risorse di calcolo. Al termine dell'esperimento, lo stato viene visualizzato come completato.
Un asset modello ottimizzato non viene creato finché non si crea una distribuzione da un esperimento di ottimizzazione completato. Per ulteriori informazioni, vedere Implementazione di un modello ottimizzato.
Controllo del numero di gettoni utilizzati
Copy link to section
Per i modelli di linguaggio naturale, le parole vengono convertite in token. 256 gettoni equivalgono a circa 130-170 parole. 128 gettoni equivalgono a circa 65-85 parole. Tuttavia, i numeri simbolici sono difficili da stimare e possono variare a seconda del modello. Per ulteriori informazioni, vedere Gettoni e tokenizzazione.
È possibile modificare il numero di gettoni consentiti nell'input e nell'output del modello durante un esperimento di ottimizzazione.
Tabella 1: Parametri numero token
Nome del parametro
Valore predefinito
Opzioni di valore
Opzioni a valore solo per l' flan-t5-xl-3b
Numero massimo di token di input
256
1–1024
1–256
Numero massimo di token di output
128
1–512
1–128
Maggiore è il numero di token di input e output consentiti, più tempo ci vuole per mettere a punto il modello. Utilizza il minor numero possibile di gettoni nei tuoi esempi, ma che rappresentino comunque correttamente il tuo caso d'uso.
Hai già un certo controllo sulla dimensione dell'input. Il testo di input utilizzato durante un esperimento di ottimizzazione proviene dai dati di addestramento. Quindi, puoi gestire la dimensione dell'input mantenendo gli input di esempio a una lunghezza prestabilita. Tuttavia, potresti ricevere dati di formazione non curati da un altro team o processo. In tal caso, è possibile utilizzare il cursore Gettoni di input massimi per gestire la dimensione dell'input. Se si imposta il parametro a 200 e i dati di addestramento hanno un input di esempio con 1.000 token, ad esempio, l'esempio viene troncato. Vengono utilizzati solo i primi 200 token dell'input di esempio.
Il valore dei token di output di Max è importante perché controlla il numero di token che il modello può generare come output durante l'addestramento. È possibile utilizzare il cursore per limitare le dimensioni dell'output, il che aiuta il modello a generare un output conciso.
Suggerimento : per le attività di classificazione, ridurre al minimo le dimensioni dell'output è un buon modo per forzare un modello generativo a restituire solo l'etichetta di classe, senza ripetere il modello di classificazione nell'output.
Valutazione dell'esperimento di messa a punto
Copy link to section
Al termine dell'esperimento, viene visualizzato un grafico della funzione di perdita che illustra il miglioramento dell'output del modello nel tempo. Le epoche sono indicate sull'asse delle ascisse e una misura della differenza tra i risultati previsti e quelli effettivi per epoca è indicata sull'asse delle ordinate. Il valore mostrato per epoca è calcolato dal valore medio della pendenza di tutti i passaggi di accumulo nell'epoca.
Quando si è soddisfatti dei risultati dell'esperimento di messa a punto, si può utilizzare il modello di fondazione messo a punto. Per ulteriori informazioni, vedere Implementazione di un modello ottimizzato.
Esegui di nuovo un esperimento di messa a punto
Copy link to section
Per ripetere un esperimento di messa a punto, completare i seguenti passaggi:
Dalla pagina Assets (Risorse) del progetto, filtra le risorse in base al tipo di risorsa Esperimenti di messa a punto.
Trova e apri la risorsa dell'esperimento di messa a punto, quindi fai clic su Nuovo modello messo a punto.
La funzione di perdita per l'esperimento di sintonizzazione è mostrata nello stesso grafico con le funzioni di perdita delle prove precedenti, in modo da poterle confrontare.
Oltre alla risorsa modello di fondazione ottimizzata, anche l'esperimento di ottimizzazione stesso viene salvato come risorsa. Se i risultati di una precedente esecuzione dell'esperimento sono migliori di quelli di una successiva, è possibile tornare alla precedente esecuzione dell'esperimento e utilizzare il modello risultante per creare una nuova implementazione del modello ottimizzata.