Puoi sviluppare soluzioni AI generative con modelli di base in IBM watsonx.ai. È possibile creare prompt per generare, classificare, riassumere o estrarre contenuti dal testo in ingresso. Scegliete tra i modelli IBM e quelli open source. È possibile ottimizzare i modelli di base per personalizzare l'output del prompt o ottimizzare le prestazioni di deduzione.
I modelli di base sono grandi modelli di intelligenza artificiale che hanno miliardi di parametri e sono addestrati su terabyte di dati. I modelli Foundation possono eseguire varie attività, tra cui testo, codice o generazione di immagini, classificazione, conversazione e altro ancora. I modelli di linguaggio di grandi dimensioni sono un sottoinsieme di modelli di base che possono eseguire attività relative a testo e codice. Watsonx.ai ha una gamma di modelli di lingua di grandi dimensioni distribuiti che puoi provare. Per i dettagli, vedi Supported foundation models.
Architettura del modello Foundation
I modelli di base rappresentano un'architettura di modello e uno scopo fondamentalmente diversi per i sistemi AI. Il seguente diagramma illustra la differenza tra i modelli AI tradizionali e i modelli di base.
Come mostrato nel diagramma, i tradizionali modelli AI si specializzano in compiti specifici. La maggior parte dei modelli di intelligenza artificiale tradizionali sono creati utilizzando il machine learning, che richiede un insieme di dati ampio, strutturato e ben etichettato che comprende un'attività specifica che si desidera affrontare. Spesso questi dataset devono essere originati, curati ed etichettati manualmente, un lavoro che richiede persone con conoscenze di dominio e richiede tempo. Dopo che è stato addestrato, un modello di IA tradizionale può fare un singolo compito bene. Il modello AI tradizionale utilizza ciò che apprende dai modelli nei dati di addestramento per prevedere i risultati in dati sconosciuti. Puoi creare modelli di machine learning per i tuoi specifici casi di utilizzo con strumenti come AutoAI e notebook Jupyter e quindi distribuirli.
Al contrario, i modelli di base vengono addestrati su dataset di grandi dimensioni, diversi e senza etichetta e possono essere utilizzati per molte attività differenti. I modelli di fondazione sono stati utilizzati per generare il testo calcolando la parola successiva più probabile nelle attività di traduzione in linguaggio naturale. Tuttavia, i fornitori di modelli stanno imparando che, quando richiesto con il giusto input, i modelli di base possono eseguire correttamente diverse altre attività. Invece di creare i tuoi modelli di base, utilizzi i modelli distribuiti esistenti e i prompt di progettazione per generare i risultati di cui hai bisogno.
Metodi di lavoro con i modelli di fondazione
Le possibilità e le applicazioni dei modelli di fondazione stanno appena iniziando a essere scoperti. Esplora e convalida i casi di utilizzo con i modelli di base in watsonx.ai per automatizzare, semplificare e velocizzare i processi esistenti o fornire valore in un nuovo modo.
È possibile interagire con i modelli di base nei modi seguenti:
- Ingegnerizzate i prompt e le inferenze distribuite direttamente nei modelli di fondazione utilizzando il Prompt Lab
- Inferenza dei modelli di fondazione distribuiti in modo programmatico utilizzando la libreria Python o l'API watsonx.ai
- Sintonizzare i modelli di fondazione per restituire l'output in un determinato stile o formato utilizzando Tuning Studio