Distribuire un modello di prompt in modo da poterlo aggiungere a un flusso di lavoro di business oppure valutare il modello di prompt per misurare le prestazioni.
Promuovi un modello di richiesta a uno spazio di distribuzione
Per promuovere un modello di prompt a uno spazio di distribuzione, il modello di prompt deve contenere almeno una variabile.
Non è possibile promuovere modelli di prompt che non contengono variabili nello spazio di distribuzione.
Per distribuire i modelli di prompt senza variabili, è necessario esportare il progetto che contiene la risorsa modello di prompt e importare il progetto nello spazio di distribuzione. Per ulteriori informazioni, vedere Importazione di un modello di prompt in uno spazio di distribuzione.
Tenete presenti le seguenti considerazioni aggiuntive per la distribuzione di un modello di prompt:
- È possibile creare solo distribuzioni di modelli di prompt che fanno riferimento a distribuzioni di modelli nello stesso progetto o spazio in cui è stata creata la distribuzione del modello. Se si promuove un modello che fa riferimento a un modello distribuito in uno spazio, una copia dell'asset del modello viene aggiunta automaticamente allo spazio. È necessario distribuire il modello nello spazio prima di distribuire il modello di prompt.
- Se si esporta un modello di richiesta che fa riferimento a un modello distribuito, l'asset del modello associato viene esportato automaticamente con il modello di richiesta. Quando si importa il modello in un nuovo contenitore, viene importato anche il modello. Il modello deve essere distribuito nel nuovo contenitore prima di distribuire il modello di prompt.
Prima di iniziare
Salvare un modello di prompt che contiene almeno una variabile come asset di progetto. Consultare Creazione di prompt riutilizzabili.
È necessario impostare le credenziali dell'attività generando una chiave API. Per ulteriori informazioni, vedere Gestione delle credenziali delle attività.
Procedura
Per distribuire un modello di prompt, completare la seguente procedura:
- Aprire il progetto contenente il modello di prompt.
- Fare clic su Promuovi a spazio per il template.
Nel campo Spazio di distribuzione di destinazione , scegli uno spazio di distribuzione o crea un nuovo spazio. Tieni presente quanto segue:
Lo spazio di distribuzione deve essere associato a un'istanza di machine learning che si trova nello stesso account del progetto in cui è stato creato il modello di prompt.
Se non disponi di uno spazio di distribuzione, scegli Crea un nuovo spazio di distribuzionee segui la procedura in Creazione di spazi di distribuzione.
Se si pianifica di valutare il modello di prompt nello spazio, il tipo di Fase di distribuzione consigliato per lo spazio è Produzione. Per ulteriori informazioni sulla valutazione, consultare Valutazione di un modello di prompt in un spazio di distribuzione.
Nota: lo stadio dello spazio di distribuzione non può essere modificato dopo la sua creazione.Suggerimento: selezionare Visualizza distribuzione nello spazio di installazione dopo la creazione. In caso contrario, è necessario eseguire ulteriori passi per trovare l'asset installato.
Nella scheda Asset dello spazio di distribuzione, fare clic su Distribuisci. Si crea una distribuzione in linea, il che significa che è possibile inviare dati all'endpoint e ricevere una risposta in tempo reale.
Facoltativo: nel campo Nome server di distribuzione , aggiungere un'etichetta univoca per la distribuzione.
Il nome del servizio viene utilizzato nell' URL dell'endpoint API che identifica l'installazione. L'aggiunta di un nome è utile perché il nome leggibile che si aggiunge sostituisce un ID univoco lungo e generato dal sistema che viene assegnato altrimenti.
Il nome del servizio astrae anche la distribuzione dai dettagli dell'istanza del servizio. Le applicazioni fanno riferimento a questo nome, che consente di modificare l'istanza del servizio sottostante senza influire sugli utenti.
Il nome può contenere fino a 36 caratteri. I caratteri supportati sono [a-z,0-9, _].
Il nome deve essere univoco nella regione IBM Cloud . Potrebbe essere richiesto di modificare il nome del servizio se il nome scelto è già in uso.
Importazione di un modello di prompt in uno spazio di distribuzione
Per distribuire i modelli di prompt senza variabili, è necessario esportare il progetto che contiene la risorsa modello di prompt e importare il progetto nello spazio di distribuzione.
Prima di iniziare
Esportare il progetto che contiene la risorsa modello di prompt come file ZIP.
Procedura
Per importare una risorsa modello di prompt in uno spazio di distribuzione, procedere come segue:
Dalla barra degli strumenti dello spazio di distribuzione, selezionare il menu a discesa Esportazione/Importazione spazio ' e fare clic su Importa spazio.
Caricare il file ZIP contenente il modello di richiesta esportato dal progetto e fare clic su Fatto.
Test del modello di prompt distribuito
Una volta completata correttamente la distribuzione, fare clic sul nome della distribuzione per visualizzare la distribuzione.
- La scheda Riferimento API include gli endpoint API e i frammenti di codice necessari per aggiungere questo modello di prompt a un'applicazione.
- La scheda Test supporta la verifica del modello di prompt. Immettere i dati di test come testo, testo in streaming o in un file JSON.
Se il servizio watsonx.governance è abilitato, vengono visualizzate anche queste schede:
- Valuta fornisce gli strumenti per valutare il template prompt nello spazio. Fare clic su Attiva per scegliere le dimensioni da valutare. Per i dettagli, consultare Valutazione dei modelli di prompt.
- AI Factsheets visualizza tutti i metadati raccolti per il modello di prompt. Utilizzare questi dettagli per tenere traccia del modello di prompt per gli obiettivi di governance e conformità. Vedere Tracking prompt templates.
Distribuzione programmatica di un modello di prompt
Quando si distribuisce un modello di prompt in modo programmatico, è necessario seguire questi passaggi:
- Spostare la risorsa modello e il modello di richiesta in uno spazio di distribuzione. Ad esempio, se si utilizza l' API watsonx.ai, si recupera il modello e si analizza
model_id
memorizzato inprompt.model_id
. Se si utilizza Data and AI Common Core API, utilizzareentity.wx_prompt.prompt.model_id
. L'ID è una stringa di chiavi divisa con:
. L'ultimo elemento della stringa è la chiave della risorsa modello, che si riferisce alla risorsa modello associata al modello. - Distribuire il modello, usando la chiave della risorsa modello del primo passo per individuare il modello da distribuire per il modello. Ad esempio, se si utilizza l'API Data and AI Common Core, la richiesta di ricerca cerca l'ID dello spazio o del progetto (
XXX
), il token dell'utente (YYY
) e la chiave della risorsa modello associata al modello di richiesta (ZZZ
).
curl --location 'https://api.dataplatform.cloud.ibm.com/v2/asset_types/wml_model/search?space_id=XXX' \
--header 'Authorization: Bearer YYY' \
--header 'Content-Type: application/json' \
--data '{
"query": "(asset.resource_key:ZZZ)",
"include": "entity",
"limit": 100
}'
- Dopo che il modello è stato distribuito con successo, distribuire il modello di prompt
Ulteriori informazioni
Valutazione di un modello di prompt in uno spazio di distribuzione
Seguire l'esercitazione Avvio rapido: valutare e tenere traccia di un modello di prompt per valutare e tenere traccia di un modello di prompt di esempio
Consultare il post del blog IBM watsonx.governance per la gestione e la garanzia delle prestazioni dei modelli AI - Un approccio prescrittivo per suggerimenti su come rendere operative le applicazioni di business e i flussi di lavoro con inferenza AI utilizzando il template di prompt distribuito in un notebook
Argomento principale Distribuzione e gestione di asset