Eine der leistungsfähigsten Funktionen von " watsonx.ai Studio ist die Möglichkeit, Datenwerte zu ändern und neue Felder aus vorhandenen Daten abzuleiten. Bei längeren Data-Mining-Projekten werden zumeist mehrere Ableitungen durchgeführt, beispielsweise die Extraktion einer Kunden-ID aus einer Zeichenfolge mit Webprotokolldaten oder das Erstellen eines Kundenkapitalwerts auf der Basis von Transaktionsdaten und demografischen Daten. Alle diese Transformationen können mit einer Reihe von Feldfunktionsknoten durchgeführt werden.
- Der Ableitungsknoten ändert Datenwerte oder erstellt neue Felder aus einem oder mehreren bestehenden Feldern. Er erstellt Felder vom Typ "Formel", "Flag", "Nominal", "Status", "Anzahl" und "Bedingt".
- Der Umcodierungsknoten transformiert ein Set kategorialer Werte in ein anderes. Die Umcodierung dient zur Reduzierung von Kategorien bzw. Neugruppierung von Daten für die Analyse.
- Der Klassierknoten erstellt automatisch neue nominale Felder auf der Grundlage eines oder mehrerer bestehender stetiger Felder (numerischer Bereich). Sie können beispielsweise ein stetiges Einkommensfeld in ein neues kategoriales Feld transformieren, das Einkommensgruppen als Abweichungen vom Mittelwert enthält. Nachdem Sie Klassen für das neue Feld erstellt haben, können Sie einen Ableitungsknoten auf der Basis der Trennwerte generieren.
- Der Dichotomknoten leitet mehrere Flagfelder auf der Grundlage der kategorialen Werte ab, die für ein oder mehrere nominale Felder definiert sind.
- Der Umstrukturierungsknoten wandelt ein nominales Feld oder ein Flagfeld in eine Gruppe von Feldern um, die mit den Werten aus einem weiteren Feld ausgefüllt werden können. Beispiel: Wenn ein Feld mit dem Namen
payment type
mit den Wertencredit
,cash
unddebit
angegeben wird, werden drei neue Felder erstellt (credit
,cash
,debit
), die jeweils den Wert der tatsächlichen Zahlung enthalten können.
Ableitungsknoten verwenden
Mithilfe des Ableitungsknotens können Sie sechs Typen neuer Felder aus einem oder mehreren Feldern erstellen:
- Formel. Das neue Feld ist das Ergebnis eines beliebigen CLEM-Ausdrucks.
- Flag. Bei dem neuen Feld handelt es sich um ein Flag, das für eine angegebene Bedingung steht.
- Nominal. Bei dem neuen Feld handelt es sich um ein nominales Feld, was bedeutet, dass es eine Gruppe angegebener Werte als Mitglieder besitzt.
- Status. Das neue Feld weist einen von zwei Statuswerten auf. Der Wechsel zwischen diesen Statuswerten wird durch eine angegebene Bedingung ausgelöst.
- Häufigkeiten. Dieses neue Feld gibt an, wie oft eine Bedingung wahr war.
- Bedingt. Das neue Feld gibt den Wert eines von zwei Ausdrücken an, je nach dem Wert einer Bedingung.
Jeder dieser Knoten enthält ein Reihe von speziellen Optionen. Diese Optionen werden in den nachfolgenden Themenabschnitten erörtert.
- Ausführung in einer Datenbank über SQL-Pushback
- Ausführung über fernen Analytic Server
- Funktionen verwenden, die im integrierten Analytic Server ausgeführt werden
- Liste ableiten
- Räumliche Funktionen aufrufen