Deploying foundation models on-demand from Resource hub
Distribuzione dei modelli di fondazione su richiesta (percorso rapido)
Ultimo aggiornamento: 14 mar 2025
Distribuzione dei modelli di fondazione su richiesta (percorso rapido)
Distribuisci un modello di fondazione su richiesta su hardware dedicato in pochi passaggi. IBM watsonx.ai fornisce una serie di modelli di base popolari che è possibile distribuire su richiesta in uno spazio di distribuzione dedicato ad uso esclusivo degli utenti che hanno accesso allo spazio. Il modo più rapido per distribuire un modello di fondazione su richiesta è selezionare e distribuire un modello dall'hub delle risorse.
Prima di iniziare
Copy link to section
È necessario impostare o abilitare le credenziali dell'attività per distribuire i modelli di fondazione su richiesta. Per ulteriori informazioni, vedere Gestione delle credenziali delle attività.
Esamina le architetture dei modelli di base supportate, i tipi di distribuzione e altre considerazioni per la distribuzione di un modello di base su richiesta. Per ulteriori informazioni, vedere Distribuzione dei modelli di fondazione su richiesta.
Guarda questo video per vedere come distribuire un modello di fondazione su richiesta.
Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.
Implementazione di un modello di fondazione su richiesta
Copy link to section
Per distribuire un modello di fondazione su richiesta dall'hub delle risorse, completare i seguenti passaggi:
Aprire l'hub Risorse dal menu di navigazione '.
Suggerimento:
Scegliere il filer Deploy-on-demand per visualizzare un elenco di modelli che è possibile distribuire su richiesta.
Nella sezione Pagamenti a ore, individuare il modello che si desidera distribuire su richiesta.
Dalla pagina dei dettagli del modello, fare clic su Deploy.
Fare clic su Distribuisci dal riquadro del modello di fondazione, quindi scegliere lo spazio di distribuzione in cui si desidera distribuire il modello di fondazione.
Importante:
È possibile distribuire solo un'istanza di un modello di fondazione su richiesta in uno spazio di distribuzione. Se il modello selezionato è già distribuito, l'utente avrà a disposizione il link alla distribuzione esistente nella sezione Dettagli. Per ulteriori informazioni, vedere la sezione Risoluzione dei problemi watsonx.ai Runtime.
Fare clic su Crea.
Dopo aver distribuito il modello, è possibile richiamare il modello di fondazione dall' Prompt Lab, o dall'API watsonx.ai.
Verifica della distribuzione
Copy link to section
Seguire questi passaggi per testare un modello di fondazione che viene distribuito su richiesta:
Nello spazio di installazione client, aprire la scheda Deployments e fare clic sul nome dell'installazione client.
Fare clic sulla scheda Test per immettere un testo di richiesta e ottenere una risposta dall'asset distribuito.
Inserite i dati di prova in uno dei seguenti formati, a seconda del tipo di risorsa distribuita:
a. Testo: Immettere i dati di input del testo per generare un blocco di testo come output. b. Flusso: Immettere i dati di input del testo per generare un flusso di testo come output. c. JSON: inserire i dati di input JSON per generare l'output in formato JSON.
Fare clic su Genera per ottenere risultati basati sulla richiesta.
Gestione della distribuzione
Copy link to section
Accedi, aggiorna, ridimensiona o elimina il tuo modello di fondazione che viene distribuito su richiesta dall'hub delle risorse.
Accesso al modello distribuito
Copy link to section
È possibile accedere al modello di fondazione che viene distribuito su richiesta dall'hub delle risorse utilizzando il link di distribuzione.
Seguite questi passaggi per accedere al link di distribuzione dall'hub Risorse:
Dal menu di navigazione, andare all'hub Risorse.
Dal catalogo dei modelli di Foundation nell'hub Risorse, selezionare il modello distribuito.
Nella sezione Dettagli della pagina dei dettagli del modello, fare clic sul collegamento Deployment.
In alternativa, è anche possibile accedere ai dettagli del modello di base distribuito su richiesta, come l'ID di distribuzione, le specifiche del software, le risorse associate e altro ancora, dalla pagina dei dettagli di distribuzione.
Aggiornamento della distribuzione
Copy link to section
Aggiornare i dettagli richiesti per il modello di fondazione distribuito su richiesta, come nome, descrizione, tag e altro. Per ulteriori informazioni, vedere Aggiornamento di un'installazione client.
Limitazione: La sostituzione della risorsa non è supportata per i modelli di fondazione che vengono distribuiti su richiesta.
Scalare la distribuzione
Copy link to section
È possibile distribuire solo un'istanza di un modello di fondazione su richiesta in uno spazio di distribuzione. Per gestire l'aumento della domanda, è possibile scalare la distribuzione creando copie aggiuntive. Per ulteriori informazioni, vedere Scalare un'installazione client.
Eliminazione di una distribuzione
Copy link to section
Quando il lavoro con il modello di fondazione distribuito su richiesta è completato, elimina la distribuzione per interrompere gli addebiti di fatturazione. Per ulteriori informazioni, vedere Eliminazione di un'installazione client.
Informazioni sui cookie del presente sitoPer il corretto funzionamento, i nostri siti Web richiedono alcuni cookie (richiesto). Inoltre, con il suo consenso, potrebbero essere utilizzati altri cookie per l'analisi dell'utilizzo del sito, per migliorare l'esperienza utente e per scopi pubblicitari.Per ulteriori informazioni, consultare le Preferenze cookie. Visitando il nostro sito web, accettate il trattamento delle informazioni da parte nostra come descritto nelladichiarazione sulla privacy di IBM.Per consentire una corretta navigazione, le preferenze per i cookie dell'utente verranno condivise sui domini Web IBM qui elencati.