Bereiten Sie eine Reihe von Eingabeaufforderungsbeispielen für die Optimierung des Modells vor. Die Beispiele müssen den Typ der Eingabe enthalten, die das Modell zur Laufzeit verarbeiten muss, sowie die entsprechende Ausgabe, damit das Modell als Antwort generiert.
Sie können eine Datei als Trainingsdaten hinzufügen.
Anforderungen an Trainingsdaten
Beachten Sie beim Erstellen Ihrer Trainingsdaten die folgenden Richtlinien:
Fügen Sie 100 bis 1.000 beschriftete Beispiele hinzu.
Zwischen 50 und 10.000 Beispiele sind zulässig.
Die Sprache der Trainingsdaten muss Englisch sein.
Halten Sie Ihre Eingabe-und Ausgabebeispiele innerhalb der maximalen Tokengrenzwerte, die vom Experiment verwendet werden. Andernfalls wird der Beispieltext abgeschnitten.
Weitere Informationen finden Sie unter Anzahl der verwendeten Tokens steuern.
Die Art und Weise, wie Tokens gezählt werden, variiert je nach Modell, wodurch die Anzahl der Tokens schwer zu schätzen ist. Bei sprachbasierten Basismodellen können Sie sich 256 Token als etwa 130-170 Wörter und 128 Token als etwa 65-85 Wörter vorstellen. Weitere Informationen finden Sie unter Tokens und Zerlegung in Tokens.
Wenn Sie das optimierte Basismodell verwenden möchten, um Daten zu klassifizieren, befolgen Sie die folgenden zusätzlichen Richtlinien:
- Versuchen Sie, die Anzahl der Klassenbezeichnungen auf maximal 10 zu begrenzen.
- Geben Sie eine gleiche Anzahl von Beispielen für jeden Klassentyp an.
Sie können das Eingabeaufforderungslabor verwenden, um Beispiele für die Trainingsdaten zu erstellen. Weitere Informationen finden Sie unter Prompt Lab.
Nachdem Sie eine repräsentative Gruppe von Beispielen erfasst haben, gruppieren Sie die Beispiele in einer Gruppe, die für das Training verwendet werden soll, und einer separaten, kleineren Gruppe, die für Testzwecke verwendet werden kann.
Dateiformatanforderungen
Die Trainingsdatendatei muss die folgenden Anforderungen erfüllen:
- Verwenden Sie eines der folgenden Formate:
- JavaScript Object Notation (JSON)
- JSON-Zeilenformat (JSONL)
- Die maximal zulässige Dateigröße beträgt 200 MB.
- Jedes Beispiel muss ein Paar aus
input
undoutput
enthalten. - Wenn der Eingabe-oder Ausgabetext Anführungszeichen enthält, versehen Sie jedes Anführungszeichen mit einem Backslash (
\
) als Escapezeichen. Beispiel:He said, \"Yes.\"
. - Zur Darstellung eines Rücklaufs oder Zeilenumbruchs können Sie die
\n
-Escapezeichenfolge verwenden, um die neue Zeile darzustellen. Zum Beispiel...end of paragraph.\nStart of new paragraph
.
JSON-Beispiel
Das folgende Beispiel zeigt einen Auszug aus einer Trainingsdatendatei mit gekennzeichneten Eingabeaufforderungen für eine Klassifikationstask im JSON-Format.
{
[
{
"input":"Message: When I try to log in, I get an error.",
"output":"Class name: Problem"
}
{
"input":"Message: Where can I find the plan prices?",
"output":"Class name: Question"
}
{
"input":"Message: What is the difference between trial and paygo?",
"output":"Class name: Question"
}
{
"input":"Message: The registration page crashed, and now I can't create a new account.",
"output":"Class name: Problem"
}
{
"input":"Message: What regions are supported?",
"output":"Class name: Question"
}
{
"input":"Message: I can't remember my password.",
"output":"Class name: Problem"
}
{
"input":"Message: I'm having trouble registering for a new account.",
"output":"Classname: Problem"
}
{
"input":"Message: A teammate shared a service instance with me, but I can't access it. What's wrong?",
"output":"Class name: Problem"
}
{
"input":"Message: What extra privileges does an administrator have?",
"output":"Class name: Question"
}
{
"input":"Message: Can I create a service instance for data in a language other than English?",
"output":"Class name: Question"
}
]
}
Beispiel für JSONL
Das folgende Beispiel zeigt einen Auszug aus einer Trainingsdatendatei mit gekennzeichneten Eingabeaufforderungen für eine Klassifikationstask im JSONL-Format.
{"input":"Message: When I try to log in, I get an error.","output":"Class name: Problem"}
{"input":"Message: Where can I find the plan prices?","output":"Class name: Question"}
{"input":"Message: What is the difference between trial and paygo?","output":"Class name: Question"}
{"input":"Message: The registration page crashed, and now I can't create a new account.","output":"Class name: Problem"}
{"input":"Message: What regions are supported?","output":"Class name: Question"}
{"input":"Message: I can't remember my password.","output":"Class name: Problem"}
{"input":"Message: I'm having trouble registering for a new account.","output":"Classname: Problem"}
{"input":"Message: A teammate shared a service instance with me, but I can't access it. What's wrong?","output":"Class name: Problem"}
{"input":"Message: What extra privileges does an administrator have?","output":"Class name: Question"}
{"input":"Message: Can I create a service instance for data in a language other than English?","output":"Class name: Question"}
Übergeordnetes Thema: Modell optimieren