Verwenden Sie Einbettungsmodelle, um Texteinbettungen zu erstellen, die die Bedeutung eines Satzes oder einer Passage erfassen, um abruferweiterte Generierungstasks zu unterstützen.
Retrieval-augmented generation (RAG) ist eine Technik, bei der ein foundation model mit Wissen aus externen Quellen angereichert wird. Sie können Texteinbettungen verwenden, um relevante Informationen von höherer Qualität zu finden, die in die Aufforderung eingefügt werden können, damit das foundation model sachlich antworten kann.
Das folgende Diagramm veranschaulicht das Muster für die abruferweiterte Generierung mit Einbettungsunterstützung.
Das Muster für die abruferweiterte Generierung mit Einbettungsunterstützung umfasst die folgenden Schritte:
- Konvertieren Sie Ihre Inhalte in Texteinbettungen und speichern Sie sie in einem Vektordatenspeicher.
- Verwenden Sie dasselbe Einbettungsmodell, um die Benutzereingabe in Texteinbettungen zu konvertieren.
- Führen Sie eine Ähnlichkeits-oder semantische Suche in Ihrer Wissensbasis für Inhalte aus, die sich auf die Frage eines Benutzers beziehen.
- Extrahieren Sie die relevantesten Suchergebnisse als Kontext in Ihre Eingabeaufforderung und fügen Sie eine Anweisung hinzu, z. B. "Beantworten Sie die folgende Frage, indem Sie nur Informationen aus den folgenden Passagen verwenden."
- Senden Sie den kombinierten Aufforderungstext (Anweisung + Suchergebnisse + Frage) an das foundation model.
- Das foundation model verwendet kontextbezogene Informationen aus der Aufforderung, um eine sachliche Antwort zu erstellen.
Ergänzung des foundation model von Prompt Lab
Das Prompt Lab verfügt über eine integrierte Funktion im Chat-Modus, die Ihnen bei der Implementierung eines RAG-Anwendungsfalls hilft. Zu Beginn verknüpfen Sie relevante Dokumente mit einer Eingabeaufforderung. Die von Ihnen hinzugefügten Dokumente werden vektorisiert und in einer Vektordatenbank gespeichert. Wenn eine Anfrage an den Chat gestellt wird, wird die Datenbank durchsucht, und die entsprechenden Ergebnisse werden in die Eingabe, die an das foundation model übermittelt wird, aufgenommen. Weitere Informationen finden Sie unter Verankerung des foundation model in kontextuellen Informationen.
Beispielnotebook
Das Beispielnotizbuch Use watsonx Granite Model Series, Chroma, and LangChain to answer questions (RAG) führt Sie durch die Schritte, die Sie befolgen müssen, um einen RAG-Anwendungsfall mit Einbettungen zu erweitern.
Weitere Informationen
- Unterstützte Einbettungsmodelle
- Retreival-erweiterte Generierung
- Vektorisierung von Text mit Hilfe der API
- Verfahren zur Überwindung von Längenbeschränkungen für Kontexte
- API-Referenz für Texteinbettungen
Übergeordnetes Thema: Retrieval-unterstützte Generierung