Feldrolle festlegen
Die Rolle eines Felds steuert, wie es bei der Modellerstellung verwendet werden soll, beispielsweise ob es sich bei einem Feld um eine Eingabe oder um ein Ziel (das vorhergesagte Element) handelt.
Folgende Rollen stehen zur Verfügung:
Eingabe. Das Feld wird als Eingabe für das Maschinenlernen verwendet (Prädiktorfeld).
Ziel. Das Feld wird als Ausgabe bzw. Ziel für das Maschinenlernen verwendet (eines der Felder, die das Modell vorherzusagen versucht).
Beide. Das Feld wird vom Apriori-Knoten sowohl als Prädiktor als auch als Ziel verwendet. Alle anderen Modellierungsknoten ignorieren das Feld.
Keine. Das Feld wird durch das Maschinenlernen ignoriert. Felder, deren Messniveau auf Ohne Typ gesetzt ist, werden in der Spalte Rolle automatisch auf Keine gesetzt.
Partition. Gibt ein Feld an, das zur Partitionierung der Daten in getrennte Stichproben für Trainings, Test- und (optional) Validierungszwecken verwendet wird. Dieses Feld muss ein instanziierter Set-Typ mit zwei oder drei möglichen Werten sein (wie in den erweiterten Einstellungen nach dem Klicken auf das Zahnradsymbol definiert). Der erste Wert steht für die Trainingsstichprobe, der zweite für die Teststichprobe und der dritte (sofern vorhanden) für die Validierungsstichprobe. Alle weiteren Werte werden ignoriert und Flagfelder können nicht verwendet werden. Um die Partition in einer Analyse zu verwenden, muss in den Knoteneinstellungen des entsprechenden Modellerstellungs- oder Analyseknotens die Partitionierung aktiviert sein. Datensätze mit Nullwerten für das Partitionsfeld werden aus der Analyse ausgeschlossen, wenn die Partitionierung aktiviert ist. Falls Sie im Ablauf mehrere Partitionsfelder definiert haben, müssen Sie in den Knoteneinstellungen für jeden zutreffenden Modellierungsknoten ein einzelnes Partitionsfeld angeben. Wenn in Ihren Daten noch kein geeignetes Feld vorhanden ist, können Sie mithilfe eines Partitionierungs- oder Ableitungsknotens eines erstellen. Weitere Informationen finden Sie unter Partitionsknoten .
Aufteilen. (Nur nominale, ordinale und Flagfelder.) Legt fest, dass ein Modell für jeden möglichen Wert des Felds erstellt werden soll.
Häufigkeit. (Nur numerische Felder.) Durch Festlegen dieser Rolle kann der Feldwert als Häufigkeitsgewichtungsfaktor für den Datensatz verwendet werden. Dieses Merkmal wird nur von CRT-, CHAID-, QUEST- und linearen Knoten unterstützt; alle anderen Knoten ignorieren diese Rolle. Die Häufigkeitsgewichtung wird mithilfe der Option Häufigkeitsgewichtung anwenden in den Knoteneinstellungen derjenigen Modellierungsknoten aktiviert, die dieses Merkmal unterstützen.
Datensatz-ID. Das Feld wird als eindeutige ID für einen Datensatz verwendet. Dieses Feature wird von den meisten Knoten ignoriert; es wird jedoch von linearen Modellen unterstützt.