Verwenden von vektorisiertem Text mit Tasks zur abruferweiterten Generierung
Letzte Aktualisierung: 04. März 2025
Verwenden von vektorisiertem Text mit Tasks zur abruferweiterten Generierung
Verwenden Sie Einbettungsmodelle, um Texteinbettungen zu erstellen, die die Bedeutung eines Satzes oder einer Passage erfassen, um abruferweiterte Generierungstasks zu unterstützen.
Die abrufgestützte Generierung (RAG) ist eine Technik, bei der eine Eingabeaufforderung für ein Fundamentmodell mit Wissen aus externen Quellen angereichert wird. Sie können Texteinbettungen verwenden, um relevante Informationen in höherer Qualität zu finden, die Sie in die Eingabeaufforderung einfügen können, um dem Modell der Stiftung bei der sachlichen Beantwortung zu helfen.
Das folgende Diagramm veranschaulicht das Muster für die abruferweiterte Generierung mit Einbettungsunterstützung.
Das Muster für die abruferweiterte Generierung mit Einbettungsunterstützung umfasst die folgenden Schritte:
Konvertieren Sie Ihre Inhalte in Texteinbettungen und speichern Sie sie in einem Vektordatenspeicher.
Verwenden Sie dasselbe Einbettungsmodell, um die Benutzereingabe in Texteinbettungen zu konvertieren.
Führen Sie eine Ähnlichkeits-oder semantische Suche in Ihrer Wissensbasis für Inhalte aus, die sich auf die Frage eines Benutzers beziehen.
Extrahieren Sie die relevantesten Suchergebnisse als Kontext in Ihre Eingabeaufforderung und fügen Sie eine Anweisung hinzu, z. B. "Beantworten Sie die folgende Frage, indem Sie nur Informationen aus den folgenden Passagen verwenden."
Senden Sie den kombinierten Aufforderungstext (Anweisung + Suchergebnisse + Frage) an das Stiftungsmodell.
Das Modell der Stiftung verwendet Kontextinformationen aus der Eingabe, um eine sachliche Antwort zu generieren.
Erweiterung des Inputs des Gründungsmodells von Prompt Lab
Copy link to section
Die Prompt Lab verfügt über eine integrierte Funktion im Chat-Modus, die Ihnen bei der Umsetzung eines RAG-Anwendungsfalls hilft. Zu Beginn verknüpfen Sie relevante Dokumente mit einer Eingabeaufforderung. Die von Ihnen hinzugefügten Dokumente werden vektorisiert und in einer Vektordatenbank gespeichert. Wenn eine Abfrage an den Chat gesendet wird, wird die Datenbank durchsucht und die entsprechenden Ergebnisse werden in die Eingabe aufgenommen, die an das Stiftungsmodell gesendet wird. Weitere Informationen finden Sie in den Kontextinformationen zu den Eingabeaufforderungen des Grounding Foundation-Modells.