0 / 0
Torna alla versione inglese della documentazione
Distribuzione di risorse di IA generativa
Ultimo aggiornamento: 30 gen 2025
Distribuzione di risorse di IA generativa

Distribuire risorse di intelligenza artificiale generativa per utilizzarle in produzione e monitorare queste risorse distribuite.

Tipi di asset distribuibili per le applicazioni di IA generativa

È possibile utilizzare watsonx.ai per distribuire le seguenti risorse per le applicazioni di IA generativa:

Distribuzione dei modelli di prompt

Dopo aver salvato un modello di prompt come asset di progetto, è possibile promuoverlo in uno spazio di distribuzione. Dallo spazio di distribuzione, è possibile distribuire il modello di prompt in produzione e ottenere l'endpoint per l'inferenza.

Se hai il servizio watsonx.governance , puoi anche acquisire e tenere traccia dei dettagli di distribuzione per un template di prompt per soddisfare i requisiti di governance.

Per ulteriori informazioni, vedere Distribuzione di un modello di prompt.

Distribuzione dei servizi di IA

Un servizio AI è un'unità di codice distribuibile che cattura la logica dei casi d'uso dell'AI generativa, come la Retrieval Augmented Generation (RAG). Quando i servizi di intelligenza artificiale sono stati distribuiti con successo, è possibile utilizzare l'endpoint per l'inferenza dalla propria applicazione.

I servizi di IA vengono creati automaticamente quando si implementa una soluzione di IA generativa complessa con strumenti visivi come Agent Lab, Prompt Lab o AutoAI. Ad esempio, se si utilizza Agent Lab o Prompt Lab per costruire e distribuire la propria soluzione di IA agenziale o generativa, lo strumento rileva automaticamente la complessità della soluzione e presenta il tipo corretto di asset di distribuzione.

Sebbene sia possibile utilizzare i modelli di prompt per creare e distribuire prompt salvati in Prompt Lab, non è possibile utilizzarli per distribuire applicazioni di IA generativa per casi d'uso complessi, come la RAG.

Se si sceglie di codificare la propria applicazione di IA generativa basata su questi casi d'uso complessi, è necessario creare un servizio di IA e assicurarsi che segua determinati requisiti. È possibile distribuire un servizio di intelligenza artificiale in modo programmatico con watsonx.ai REST API o con la libreria client Python. Dopo aver distribuito il servizio AI, è possibile utilizzare l'endpoint per l'inferenza.

Per ulteriori informazioni, vedere Distribuzione dei servizi AI.

Distribuzione dei modelli sintonizzati

Dopo aver sintonizzato un foundation model e salvato il modello sintonizzato come risorsa del progetto, è possibile promuoverlo in uno spazio di distribuzione. Dallo spazio di distribuzione, è possibile testare il modello sintonizzato e ottenere l'endpoint per l'inferenza.

Per ulteriori informazioni, vedere Distribuzione di un foundation model sintonizzato.

Distribuzione di modelli di fondazione personalizzati

Oltre a lavorare con i modelli di fondazione curati da IBM, è possibile caricare e distribuire i propri modelli di fondazione. Dopo che i modelli sono stati distribuiti e registrati con watsonx.ai, creare prompt che inferiscono i modelli personalizzati da Prompt Lab.

L'implementazione di un foundation model personalizzato offre la flessibilità necessaria per implementare le soluzioni di intelligenza artificiale più adatte al vostro caso d'uso.

Per ulteriori informazioni, vedere Distribuzione di un foundation model personalizzato.

Distribuzione dei modelli di fondazione su richiesta

Distribuire un foundation model on-demand su hardware dedicato per rendere il foundation model disponibile per l'uso in varie applicazioni e servizi secondo le necessità. Utilizzando questo approccio, è possibile accedere alle capacità di questi potenti modelli di fondazione senza la necessità di disporre di ampie risorse di calcolo. I modelli Foundation distribuiti on-demand sono ospitati in uno spazio di distribuzione dedicato dove è possibile utilizzare questi modelli per l'inferenza.

Per ulteriori informazioni, vedere Distribuzione dei modelli di fondazione su richiesta.

Ulteriori informazioni

Argomento principale: Distribuzione di asset con il runtime watsonx.ai