Lösungsmuster für die Beantwortung von Fragen mit abrufgestützter Generierung

Letzte Aktualisierung: 07. März 2025
Lösungsmuster für die Beantwortung von Fragen mit abrufgestützter Generierung

Sie können eine generative KI-Lösung erstellen, die Benutzerfragen auf der Grundlage von Informationen in einer Wissensdatenbank beantwortet, indem Sie das RAG-Muster (Retrieval-Augmented Generation) anwenden.

Anwendungsfall und Anforderungen

Das RAG-Muster ist nützlich, wenn Sie ein Grundmodell benötigen, um die Antworten auf Fragen mit den von Ihnen bereitgestellten Informationen zu ergänzen. Nehmen wir zum Beispiel an, Sie möchten einen Chatbot für Ihr neues Produkt implementieren, der Fragen auf der Grundlage der Dokumentation Ihres Produkts beantwortet.

Eine RAG-Lösung, die Fragen auf der Grundlage von Produktdokumentationen beantwortet, könnte folgende Aufgaben umfassen:

  • Die Antwort auf die Frage des Benutzers finden Sie in der Produktdokumentation.
  • Erstellen Sie Antworten auf der Grundlage der Produktdokumentation.
  • Link zu den Dokumentationsthemen, die die Antwort lieferten.
  • Speichern Sie alle Fragen und Antworten.
  • Sammeln Sie Feedback von Benutzern zu den Antworten.
  • Geben Sie den Verfassern der Dokumentation negatives Feedback.

Lösungsarchitektur

Ein RAG-Muster enthält in der Regel die folgenden Komponenten:

  • Eine Wissensdatenbank, die die Quelldokumente enthält.
  • Ein Einbettungsmodell, das den Text in den Dokumenten in Vektoreinbettungen umwandelt, die numerische Darstellungen sind.
  • Eine Vektordatenbank, in der die Vektoreinbettungen Ihrer Dokumente gespeichert sind, und ein Vektorindex, der Inhalte sucht und abruft.
  • Eine Vorlage, die die Frage des Benutzers, den abgerufenen Inhalt und Anweisungen zum Generieren einer Antwort kombiniert.
  • Ein Modell, das auf Grundlage der abgerufenen Inhalte eine Antwort auf die Frage eines Benutzers generiert.

"Bildbeschreibung im umgebenden Text."

Die fertige Lösung könnte auch die folgenden Komponenten enthalten:

  • Eine App mit einer Benutzeroberfläche, über die Benutzer Fragen stellen, Antworten erhalten und Feedback zu den Antworten geben können.
  • Ein Reranking-Modell, das die abgerufenen Ergebnisse neu ordnet, basierend darauf, wie gut sie die Frage beantworten, und nicht darauf, wie ähnlich die Ergebnisse der Frage sind.
  • Ein Protokoll der Fragen, Antworten und des Nutzerfeedbacks.
  • Eine Methode, um das Feedback an die Verfasser der Dokumentation weiterzugeben, die die Dokumentation aktualisieren können, damit die Lösung bessere Antworten generiert.
  • Eine Methode, um die besten Experten zu ermitteln, die auf unbefriedigende Antworten reagieren können.

Die folgende Grafik veranschaulicht beispielsweise, wie Sie Ihre RAG-Lösung optimieren können, indem Sie Ihre Inhalte anpassen, um die KI-Antworten auf der Grundlage des Nutzerfeedbacks zu verbessern.

"Bildbeschreibung im umgebenden Text."

Umsetzung der Lösung

Um eine RAG-Musterlösung zu implementieren, befolgen Sie diese Hauptschritte:

  1. Erstellen Sie eine Vektordatenbank.
  2. Erstellen Sie einen Vektorindex.
  3. Geben Sie den Vektorindex in der Eingabeaufforderung an.
  4. Beurteilen Sie die Eingabeaufforderung.
  5. Fügen Sie optionale Komponenten hinzu.
  6. Verwenden Sie das Muster als KI-Dienst.
  7. Rufen Sie den KI-Service-Endpunkt in Ihrer Anwendung auf.

Dienstprogramme

Sie können einen schnellen Konzeptnachweis unter Prompt Lab erstellen. Sie können eine Dokumentdatei hochladen und im In-Memory-Vektorspeicher einen Vektorindex dafür erstellen. Siehe Chatten mit Dokumenten. Wenn Sie eine Vektordatenbank einrichten, können Sie einen Vektorindex erstellen, auf den Sie in einer Eingabeaufforderung verweisen können. Siehe "Hinzufügen von vektorisierten Dokumenten für die Eingabeaufforderungen des Grundmodells ".

Sie können Ihre RAG-Lösung mit dem Q&A mit RAG-Beschleuniger beschleunigen. Der Beschleuniger ist ein Beispielprojekt, das ein RAG-Muster mit einer Reihe von Python -Notizbüchern implementiert, die Sie für Ihre Lösung anpassen können. Siehe Fragen und Antworten mit RAG-Beschleuniger.

Sie können die Suche nach dem besten RAG-Muster automatisieren und das Tool AutoAI ausführen, um eine RAG-Lösung zu erstellen. AutoAI automatisiert den End-to-End-Fluss vom Experiment bis zur Bereitstellung. Siehe Automatisierung eines RAG-Musters mit AutoAI.

Sie können die Benutzeroberfläche überspringen und Code mit REST-APIs, Python -Bibliotheken oder Node.js -SDKs schreiben. Siehe watsonx Developer Hub.

Weitere Informationen

Übergeordnetes Thema: Planung einer generativen KI-Lösung