0 / 0
Torna alla versione inglese della documentazione
Esempi end-to-end: acceleratori di settore
Ultimo aggiornamento: 10 feb 2025
Esempi end-to-end: acceleratori di settore

Gli acceleratori di settore forniti da IBM sono una serie di soluzioni end-to-end che possono essere utilizzate come esempi o personalizzate per risolvere problemi aziendali comuni.

Panoramica degli acceleratori di settore

Un acceleratore industriale è progettato per aiutarvi a risolvere un problema aziendale specifico con una soluzione di IA generativa. Sfogliate gli acceleratori nell'hub delle risorse e create quelli che desiderate.

Un acceleratore consiste in un progetto campione che contiene tutto ciò che serve per costruire una soluzione di intelligenza artificiale. Il progetto campione può includere risorse di dati, notebook Jupyter, script, lavori e set di parametri.

Panoramica dei processi

Ogni acceleratore fornisce istruzioni dettagliate. Queste fasi forniscono una panoramica del processo per progetti campione:

Per iniziare a lavorare con un acceleratore:

  1. Andate al progetto di esempio nell'hub delle risorse. È possibile filtrare i campioni nell'hub delle risorse per vedere tutti i progetti o gli acceleratori di settore.
  2. Fare clic su Crea progetto e completare i passaggi per creare il progetto.
  3. Seguite le istruzioni per eseguire i notebook e completare altre operazioni.

Domande e risposte con l'acceleratore RAG

Provate le Q&A con RAG Accelerator per impostare la generazione aumentata dal reperimento (RAG) per generare risultati accurati e basati sulle informazioni dei documenti forniti. Per accedere all'acceleratore nell'hub delle risorse è necessario aver effettuato il login a watsonx.

Il Q&A con RAG Accelerator fornisce un modello e un'implementazione RAG avanzati che includono i seguenti processi:

  • Elaborazione dei documenti: Conversione, elaborazione e indicizzazione di documenti per generare un indice vettoriale.
  • Generazione di risposte: Risposta alle domande mediante generazione aumentata del reperimento sulla base dei risultati della ricerca vettoriale.
  • Registrazione di input/output: Registrazione delle domande, dei chunk e dei metadati recuperati e delle risposte in un indice di log secondario.
  • Raccolta del feedback dell'utente: Il feedback dell'utente viene aggiunto alle voci di registro di input/output corrispondenti.
  • Analisi dei contenuti: Un rapporto sui contenuti specifici che devono essere migliorati per migliorare le risposte che hanno ricevuto un feedback negativo dagli utenti.
  • Intervento umano: L'identificazione dei migliori esperti per rispondere alle risposte insoddisfacenti utilizzando un indice vettoriale con profili di esperti.

Il grafico seguente mostra come i processi di Q&A con RAG Accelerator siano ciclici, in modo che il contenuto del documento venga aggiornato in base al feedback degli utenti.

Descritto nel testo circostante

Elaborazione dei documenti

Un notebook per l'elaborazione e l'indicizzazione dei documenti automatizza la conversione, la suddivisione e l'indicizzazione dei documenti in un indice vettoriale in uno di questi database vettoriali:

  • watsonx.data Milvus
  • watsonx Discovery con Elastic Search Enterprise o IBM Cloud Databases for Elasticsearch Platinum.

La raccolta di documenti di esempio da vettorializzare è una versione di questa documentazione watsonx as a Service impostata in un file ZIP. È possibile personalizzare il notebook per eseguire indici vettoriali esistenti creati al di fuori di watsonx con altri strumenti, ad esempio connettori e pipeline Elastic, pipeline Spark o processi propri.

Generazione di risposte

Il notebook per la funzione Q&A Python definisce il codice della funzione Python e ne automatizza la distribuzione con un suffisso URL ben definito in uno spazio di distribuzione. Il Q&A con codice funzione RAG Python è configurato da set di parametri. La funzione prende in input una domanda e interroga l'indice vettoriale per recuperare i chunk più rilevanti per rispondere alla domanda e i metadati dei chunk, compresi i link ai documenti di partenza. La funzione aggiunge i pezzi più rilevanti al modello di prompt configurato e restituisce la risposta generata, il punteggio di fedeltà calcolato e i pezzi recuperati con i metadati.

Registrazione di ingresso/uscita

Per ogni chiamata alla funzione Q&A with RAG Python, è possibile attivare la registrazione del testo di input e output del prompt. Qualsiasi PII viene eliminato dalle stringhe prima della registrazione. L'indice dei registri è separato dall'indice vettoriale per i documenti del database vettoriale.

Se la registrazione dell'input/output è attiva, è possibile attivare i suggerimenti per il completamento delle domande quando gli utenti digitano le loro domande. Se l'utente accetta un completamento basato su una domanda a cui ha risposto di recente, la risposta viene recuperata dall'indice del registro, con un risparmio di tempo e di costi di inferenza e recupero da parte della GPU.

Raccolta del feedback degli utenti

Il feedback degli utenti aiuta le parti interessate a capire quanto funziona la soluzione per i loro utenti, quali sono gli argomenti dei documenti a cui gli utenti sono interessati e quanto la soluzione risponde alle domande basate sul contenuto. È possibile configurare l'applicazione in modo che richiami la funzione Q&A with RAG Python per raccogliere i commenti degli utenti sulle risposte. Il feedback dell'utente, costituito da un punteggio di soddisfazione e da un commento opzionale, viene quindi aggiunto al registro delle domande e risposte per una successiva analisi.

Analisi del contenuto

È possibile configurare il notebook di analisi del feedback degli utenti ed eseguirlo direttamente o come lavoro. Il blocco note interroga i dati di log per l'intervallo di tempo specificato o per le date di inizio e fine. Il notebook carica i dati di log in un dataframe e utilizza il rilevamento non supervisionato degli argomenti di BERTopic o di Watson Natural Language Processing per determinare quali argomenti dei documenti sono stati recuperati più frequentemente per generare risposte. Il taccuino analizza e visualizza la soddisfazione degli utenti per argomento e include le domande, le risposte e i commenti di feedback degli utenti per le risposte con una valutazione bassa. Sulla base di questi dati, gli stakeholder e i proprietari dei contenuti di conoscenza possono migliorare i contenuti per ottenere risposte migliori.

Intervento umano

Quando un utente non è soddisfatto di una risposta, è possibile configurare l'applicazione in modo che recuperi un contatto esperto in grado di fornire una risposta migliore. È possibile configurare il notebook di profilazione degli esperti per elaborare i documenti del profilo degli esperti e costruire un indice basato su tali informazioni. Ad esempio, l'applicazione può indirizzare la domanda all'esperto, inviare la risposta dell'esperto all'utente e avvisare il proprietario della base di conoscenza di un possibile miglioramento del contenuto.

Argomento principale Introduzione