Lösungsmuster für die Beantwortung von Fragen mit abrufgestützter Generierung
Letzte Aktualisierung: 07. März 2025
Lösungsmuster für die Beantwortung von Fragen mit abrufgestützter Generierung
Sie können eine generative KI-Lösung erstellen, die Benutzerfragen auf der Grundlage von Informationen in einer Wissensdatenbank beantwortet, indem Sie das RAG-Muster (Retrieval-Augmented Generation) anwenden.
Anwendungsfall und Anforderungen
Copy link to section
Das RAG-Muster ist nützlich, wenn Sie ein Grundmodell benötigen, um die Antworten auf Fragen mit den von Ihnen bereitgestellten Informationen zu ergänzen. Nehmen wir zum Beispiel an, Sie möchten einen Chatbot für Ihr neues Produkt implementieren, der Fragen auf der Grundlage der Dokumentation Ihres Produkts beantwortet.
Eine RAG-Lösung, die Fragen auf der Grundlage von Produktdokumentationen beantwortet, könnte folgende Aufgaben umfassen:
Die Antwort auf die Frage des Benutzers finden Sie in der Produktdokumentation.
Erstellen Sie Antworten auf der Grundlage der Produktdokumentation.
Link zu den Dokumentationsthemen, die die Antwort lieferten.
Speichern Sie alle Fragen und Antworten.
Sammeln Sie Feedback von Benutzern zu den Antworten.
Geben Sie den Verfassern der Dokumentation negatives Feedback.
Lösungsarchitektur
Copy link to section
Ein RAG-Muster enthält in der Regel die folgenden Komponenten:
Eine Wissensdatenbank, die die Quelldokumente enthält.
Ein Einbettungsmodell, das den Text in den Dokumenten in Vektoreinbettungen umwandelt, die numerische Darstellungen sind.
Eine Vektordatenbank, in der die Vektoreinbettungen Ihrer Dokumente gespeichert sind, und ein Vektorindex, der Inhalte sucht und abruft.
Eine Vorlage, die die Frage des Benutzers, den abgerufenen Inhalt und Anweisungen zum Generieren einer Antwort kombiniert.
Ein Modell, das auf Grundlage der abgerufenen Inhalte eine Antwort auf die Frage eines Benutzers generiert.
Die fertige Lösung könnte auch die folgenden Komponenten enthalten:
Eine App mit einer Benutzeroberfläche, über die Benutzer Fragen stellen, Antworten erhalten und Feedback zu den Antworten geben können.
Ein Reranking-Modell, das die abgerufenen Ergebnisse neu ordnet, basierend darauf, wie gut sie die Frage beantworten, und nicht darauf, wie ähnlich die Ergebnisse der Frage sind.
Ein Protokoll der Fragen, Antworten und des Nutzerfeedbacks.
Eine Methode, um das Feedback an die Verfasser der Dokumentation weiterzugeben, die die Dokumentation aktualisieren können, damit die Lösung bessere Antworten generiert.
Eine Methode, um die besten Experten zu ermitteln, die auf unbefriedigende Antworten reagieren können.
Die folgende Grafik veranschaulicht beispielsweise, wie Sie Ihre RAG-Lösung optimieren können, indem Sie Ihre Inhalte anpassen, um die KI-Antworten auf der Grundlage des Nutzerfeedbacks zu verbessern.
Umsetzung der Lösung
Copy link to section
Um eine RAG-Musterlösung zu implementieren, befolgen Sie diese Hauptschritte:
Erstellen Sie eine Vektordatenbank.
Erstellen Sie einen Vektorindex.
Geben Sie den Vektorindex in der Eingabeaufforderung an.
Beurteilen Sie die Eingabeaufforderung.
Fügen Sie optionale Komponenten hinzu.
Verwenden Sie das Muster als KI-Dienst.
Rufen Sie den KI-Service-Endpunkt in Ihrer Anwendung auf.
Dienstprogramme
Copy link to section
Sie können einen schnellen Konzeptnachweis unter Prompt Lab erstellen. Sie können eine Dokumentdatei hochladen und im In-Memory-Vektorspeicher einen Vektorindex dafür erstellen. Siehe Chatten mit Dokumenten. Wenn Sie eine Vektordatenbank einrichten, können Sie einen Vektorindex erstellen, auf den Sie in einer Eingabeaufforderung verweisen können. Siehe "Hinzufügen von vektorisierten Dokumenten für die Eingabeaufforderungen des Grundmodells ".
Sie können Ihre RAG-Lösung mit dem Q&A mit RAG-Beschleuniger beschleunigen. Der Beschleuniger ist ein Beispielprojekt, das ein RAG-Muster mit einer Reihe von Python -Notizbüchern implementiert, die Sie für Ihre Lösung anpassen können. Siehe Fragen und Antworten mit RAG-Beschleuniger.
Sie können die Suche nach dem besten RAG-Muster automatisieren und das Tool AutoAI ausführen, um eine RAG-Lösung zu erstellen. AutoAI automatisiert den End-to-End-Fluss vom Experiment bis zur Bereitstellung. Siehe Automatisierung eines RAG-Musters mit AutoAI.
Sie können die Benutzeroberfläche überspringen und Code mit REST-APIs, Python -Bibliotheken oder Node.js -SDKs schreiben. Siehe watsonx Developer Hub.
Über den Einsatz von Cookies auf dieser WebsiteUnsere Websites benötigen einige Cookies, um ordnungsgemäß zu funktionieren (erforderlich). Darüber hinaus können mit Ihrer Zustimmung weitere Cookies verwendet werden, um die Nutzung der Website zu analysieren, die Benutzerfreundlichkeit zu verbessern und Werbung zu schalten.Weitere Informationen finden Sie in Ihren Cookie-Benutzervorgaben. Durch den Besuch unserer Website erklären Sie sich mit der Verarbeitung von Informationen einverstanden, wie in der IBMDatenschutzbestimmung beschrieben.Um eine reibungslose Navigation zu ermöglichen, werden Ihre Cookie-Präferenzen über die hier aufgeführten IBM Web-Domains hinweg gemeinsam genutzt.