0 / 0
Torna alla versione inglese della documentazione
Ottimizzazione di un modello di fondazione a livello di programmazione
Ultimo aggiornamento: 26 feb 2025
Ottimizzazione di un modello di fondazione a livello di programmazione

È possibile mettere a punto in modo programmatico un insieme di modelli di fondazione in watsonx.ai per personalizzarli in base al proprio caso d'uso.

Modi per sviluppare

È possibile mettere a punto i modelli di fondazione utilizzando questi metodi di programmazione:

In alternativa, si possono usare gli strumenti grafici dell'interfaccia utente di watsonx.ai per mettere a punto i modelli di fondazione. Vedi Tuning Studio.

API REST

La messa a punto immediata di un modello di base utilizzando l'API è un compito complesso. I taccuini di esempio per l' Python e semplificano il processo. È possibile utilizzare un quaderno di esempio come modello per scrivere i propri quaderni per la messa a punto dei prompt. Vedere Regolazione di un modello di fondazione in modo programmatico.

Modelli di fondazioni supportate

Vedere Scelta di un modello di base da mettere a punto.

Per ottenere un elenco di modelli di fondazione che supportano la messa a punto rapida a livello di programmazione, è possibile utilizzare la seguente richiesta:

curl -X GET \
  'https://{hostname}/ml/v1/foundation_model_specs?version=2025-02-20&filters=function_prompt_tune_trainable'
Nota:Non è possibile eseguire una messa a punto rapida di un modello di fondazione personalizzato.

Procedura

A un livello elevato, la messa a punto tempestiva di un modello di base utilizzando l'API prevede i seguenti passaggi:

  1. Creare una credenziale di attività.

    Una credenziale di attività è una chiave API utilizzata per autenticare attività di lunga durata avviate tramite i passaggi descritti in questa procedura. Non è necessario passare le credenziali dell'attività nella richiesta API. Una credenziale di attività creata dall'utente deve esistere nel servizio credenziali per l' user_id e l' account_id. Vedere Creazione di credenziali per attività.

  2. Creare un file di dati di addestramento da utilizzare per la messa a punto del modello di fondazione.

    Per ulteriori informazioni sui requisiti dei file di dati di addestramento, vedere Formati dei dati per la messa a punto dei modelli di fondazione.

  3. Caricare il file dei dati di allenamento.

    È possibile scegliere di aggiungere il file creando uno dei seguenti tipi di risorse:

    • asset di connessione

      Nota : attualmente è supportato solo il tipo di connessione Cloud Object Storage per il training di sintonizzazione rapida.

      Vedere Riferimento ai file dell'API.

      L'ID della connessione e i dettagli del file dei dati di addestramento verranno utilizzati quando si aggiungerà la sezione training_data_references al file request.json creato nel passaggio successivo.

    • Asset di dati

      Per creare un asset di dati, utilizzare l'API Data and AI Common Core per definire un asset di dati.

      Utilizzerai l'ID risorsa e i dettagli del file di dati di formazione quando aggiungerai la sezione " training_data_references " della richiesta REST che creerai nel passaggio successivo.

    Per ulteriori informazioni sui modi supportati per fare riferimento a un file di dati di allenamento, vedere Riferimenti ai dati.

  4. Utilizzare l'API watsonx.ai per creare un esperimento di formazione.

    Vedere Creare una formazione.

    È possibile specificare i parametri dell'esperimento nel payload di TrainingResource. Per ulteriori informazioni sui parametri disponibili, vedere Parametri per la messa a punto dei modelli di fondazione.

    Per l' task_id, specificare una delle attività elencate come supportate per il modello di fondazione nella risposta al metodo Elenca i modelli di fondazione disponibili.

  5. Salvare il modello sintonizzato nel servizio di repository per generare un asset_id che punta al modello sintonizzato.

    Per salvare il modello sintonizzato, utilizzare l'API watsonx.ai Runtime (ex Watson Machine Learning ) per creare un nuovo modello.

  6. Usare l'API watsonx.ai per creare un deployment per il modello sintonizzato.

    Vedere Creare un'installazione client

Per eseguire l'inferenza di un modello sintonizzato, è necessario utilizzare l'endpoint di inferenza che include l'ID univoco dell'installazione client che ospita il modello sintonizzato. Per ulteriori informazioni, vedere i metodi di inferenza nella sezione Deployments.

Argomento principale: Codificare soluzioni di IA generativa