0 / 0
Zurück zur englischen Version der Dokumentation

Bausteine für Regellogik oder Regelausgabe

Letzte Aktualisierung: 13. Dez. 2024
Bausteine für Regellogik oder Regelausgabe

Verwenden Sie logische Ausdrücke, um Regellogik in einer Datenqualitätsdefinition oder Spalteninhalt in der Ausgabetabelle von Datenqualitätsregeln zu definieren.

Diese logischen Ausdrücke folgen einer grundlegenden Syntax, bei der eine Variable, z. B. ein Wort oder ein Begriff, auf der Basis einer angegebenen Bedingung oder eines bestimmten Prüftyps ausgewertet wird.

Ein Regelausdruck kann aus den folgenden Elementtypen bestehen:

Jeder Regelausdruck besteht aus mindestens einer Prüfung und kann verschiedene Prüfungen kombinieren. Überprüfen Sie auch die bereitgestellten Beispiele , um zu sehen, wie Sie die Ausdrücke verwenden können.

Variablen und Literale

Variablen und Literale sind Elemente, die Sie mit Prüfungen, Operationen und allgemeinen, Datums-oder Zeit-, mathematischen und Zeichenfolgeelementen kombinieren. Sie binden logische Variablen an physische Datenquellen, wenn Sie eine Regel aus der Datenqualitätsdefinition erstellen. Sie können die folgenden Typen auswählen:

Tabelle 1. Variablen und Literale
Element Beschreibung
var Eine logische Variable Bei Variablennamen wird die Groß-/Kleinschreibung nicht beachtet. Var1 und var1 beziehen sich auf dieselbe Variable. Namen können die folgenden Zeichen enthalten:
Alphabetische Zeichen
Unicode-Zeichen, die zur Buchstabenkategorie
Numerische Zeichen
Unterstrich (_)
Fragezeichen (?)
Dollarzeichen ($)
Das erste Zeichen eines Variablennamens muss ein alphabetisches Zeichen sein. Namen dürfen keine Punkte und Leerzeichen enthalten.
0.123 Ein numerischer Wert.
'value' Ein Zeichen oder eine Zeichenfolge mit Zeichen und Zahlen, die in einfache Anführungszeichen eingeschlossen werden müssen. Wenn die Zeichenfolge ein einfaches Anführungszeichen enthält, stellen Sie dem einfachen Anführungszeichen einen umgekehrten Schrägstrich voran. Enthält die Zeichenfolge einen umgekehrten Schrägstrich, stellen Sie diesem einen weiteren umgekehrten Schrägstrich voran.
null Prüft auf Nullwerte.
{value1,value2} Eine durch Kommas getrennte Liste mit Werten.

Logik

Kombinieren Sie Logikblöcke mit Prüflogik. Die Basislogik ist eine einzelne Prüfung, z. B. field1 exists. Sie können diese Logik erweitern, indem Sie Bedingungen hinzufügen und mithilfe von Operatoren verknüpfen. Sie können Teile des Ausdrucks in runde Klammern einschließen, um die Priorität anzugeben. marital_status='married' and (age<18 or age>100) unterscheidet sich von (marital_status='married' and age<18) or age>100

Tabelle 2.Logic
Blockelement Ausdruck Beschreibung
Nicht [] nicht logisch Negiert den Ausdruck:
not (ucase(PrimaryName) contains 'TEST')
[] Oder [] logic1 oder logic2 Entweder logic1 oder logic2 muss wahr sein:
UnhandledNameData not exists OR len(trim(UnhandledNameData)) = 0
[] Und [] logic1 und logic2 Sowohl logic1 als auch logic2 müssen wahr sein:
IF Field1 exists AND len(trim(Field1)) <> 0 THEN Field1 is_numeric
Wenn [] Dann [] Wenn check1 , dann check2 Bedingungsausdruck:
IF NamePrefix exists THEN len(trim(NamePrefix)) > 1
If [] Dann [] Sonst [] if check1 then check2 else check2 Bedingungsausdruck mit alternativem Pfad:
if age >= 18 then credit_card exists else (not credit_card exists)

Prüfungen

Prüfungen für verschiedene Bedingungen angeben: logischer Vergleich, Übereinstimmung, Vorkommen. Eine Prüfung ist ein Teil des Ausdrucks, der zu einem booleschen Ergebnis ausgewertet wird.

Logische Vergleiche

Tabelle 3. Logische Vergleiche
Blockelement Ausdruck Beschreibung
[ ] < [ ] x < j Prüft, ob der erste Wert kleiner als der zweite Wert ist.
[ ] <= [ ] x < = j Prüft, ob der erste Wert kleiner-gleich dem zweiten Wert ist.
[ ] <> [ ] x < > j Prüft, ob der erste Wert ungleich dem zweiten Wert ist.
[ ] = [ ] x = j Prüft, ob der erste Wert dem zweiten Wert entspricht. Verwenden Sie für boolesche Vergleiche 0 oder 1 als zweiten Wert.
[ ] > [ ] x > j Prüft, ob der erste Wert größer als der zweite Wert ist.
[ ] >= [ ] x > = j Prüft, ob der erste Wert größer-gleich dem zweiten Wert ist.

Die Quellendaten und die Referenzdaten müssen kompatible Datentypen aufweisen. Sie können einen Ausdruck, der aus Skalarfunktionen, Rechenoperationen und Variablen besteht, als Quellendaten verwenden. Der Ausdruck muss in einen Zeichen-oder Zeichenfolgedatentyp ausgewertet werden.

Bei Zeichenfolgedaten muss bei logischen Vergleichen die Groß-/Kleinschreibung beachtet werden. Alle nachfolgenden Leerzeichen in dem Wert, den Sie überprüfen, werden ignoriert. Leerzeichen am Anfang der zu prüfenden Werte werden nicht ignoriert. Zusätzliche Leerzeichen oder Zeichen oder Unterschiede zwischen Groß-und Kleinbuchstaben können eine erfolgreiche Validierung verhindern. Sie können Trimmen und Änderungen verwenden, um die Werte zu standardisieren.

Abgleich

Tabelle 4. Abgleich
Blockelement Ausdruck Beschreibung
[] enthält Unterzeichenfolge [] x enthält y Prüft, ob der erste Wert die Unterzeichenfolge enthält, die Sie angeben.
Hinweise:
Bei der Einschlussprüfung wird die Groß-/Kleinschreibung beachtet.
Quellen-und Referenzdaten müssen Zeichenfolgen sein.
Anführungszeichen sind erforderlich, wenn die Zeichenfolge ein fest codiertes Literal ist.
Sowohl Quellen-als auch Referenzdaten können eine Variable oder das Ergebnis einer Skalarfunktion sein.
Sie können einen Ausdruck, der aus Skalarfunktionen, Rechenoperationen und Variablen besteht, als Quellendaten verwenden. In diesem Fall müssen Sie sicherstellen, dass jeder Ausdruck als ein Wert mit einem Zeichen- oder Zeichenfolgedatentyp bewertet wird.
[] ist vorhanden x ist vorhanden Prüft, ob der Wert vorhanden ist.
[] ist in Referenzspalte [] enthalten x in_reference_column j Prüft, ob der erste Wert in der angegebenen Referenzspalte vorhanden ist. Quellen-und Referenzdaten müssen kompatible Datentypen haben.
[] ist ein Datum im Format [] x is_datum y Prüft, ob der erste Wert ein Datum im angegebenen Format ist. Siehe Zulässige Datumsformate. Wenn Sie den Ausdruck manuell konfigurieren, schließen Sie das Format in einfache Anführungszeichen ein.
[] ist in einer Referenzliste [] x referenzliste y Prüft, ob der erste Wert in der angegebenen Referenzliste enthalten ist. Quellen-und Referenzdaten müssen kompatible Datentypen haben.
[] ist numerisch x ist numerisch Prüft, ob der Wert ein numerischer Wert ist. Diese Prüfung akzeptiert nicht formatierte Zahlen oder Zahlen, die ländereinstellungsspezifisch formatiert sind, z. B. "100,000.00." Standardmäßig wird die aktuelle Locale verwendet.
[] stimmt mit Datenklasse [] überein x Übereinstimmungen_Datenklasse y Überprüft, ob der erste Wert mit der Datenklasse übereinstimmt, die durch den Klassencode identifiziert wird, den Sie als zweiten Wert angegeben haben.
Um den Klassencode für eine bestimmte Datenklasse zu finden, verwenden Sie die IBM Knowledge Catalog API GET /v3/data_classes/{artifact_id}/versions/{version_id}. Die Artefakt- und Versions-IDs für den Aufruf finden Sie in der URL der Datenklasse. Der Klassencode befindet sich im Abschnitt entity der Antwort.
Sie können diese Prüfung nur mit wertbasierten Datenklassen verwenden. Solche Datenklassen zeigen Wert als Codebereich im Bereich Datenabgleich auf der Registerkarte Übersicht an. Sie können die Bereichsinformationen auch unter Details zu vordefinierten Datenklassenüberprüfen.
[] entspricht Format [] x Abgleichformat y Prüft, ob der erste Wert dem angegebenen Format entspricht. Das Muster definiert explizit, was an jeder bestimmten Zeichenposition zulässig ist. Sie können die folgenden Operatoren verwenden, um das Muster zu erstellen:
'A' für einen beliebigen Großbuchstaben
'a' für einen beliebigen Kleinbuchstaben
'9' für eine beliebige 0-9-Ziffer
'x' für einen beliebigen alphanumerischen Wert, unabhängig von der Groß-/Kleinschreibung
'I' für einen CJKV-Ideograph (Chinesisch, Japanisch, Koreanisch oder Vietnamesisch), wie durch den Unicode-Standard definiert.
Jedes andere Zeichen in der Musterzeichenfolge gibt an, dass Sie explizit nach dem genau eingegebenen Zeichen suchen.
Die Quellendaten müssen einen Zeichendatentyp aufweisen.
[] stimmt mit regex [] überein x Abgleich_regex y Prüft, ob der erste Wert mit dem durch den regulären Ausdruck angegebenen Muster übereinstimmt. Die Perl -Bibliothek für reguläre Ausdrücke wird für diese Auswertungstypen verwendet.

Vorkommen

Tabelle 5. Vorkommen
Element Ausdruck Beschreibung
[] ist eindeutig x eindeutig Prüft, ob der Wert in der Spalte eindeutig ist.
[] tritt auf [] Zeit (en) x tritt auf y Prüft, ob der erste Wert in der Spalte so oft wie angegeben vorkommt.
[] tritt mindestens [] Zeit (en) auf x Vorkommen > = y Prüft, ob der erste Wert in der Spalte mindestens so oft wie angegeben vorkommt.
[] tritt höchstens [] Zeit (en) auf x occurs < = j Prüft, ob der erste Wert in der Spalte höchstens so oft wie angegeben vorkommt.
[] tritt weniger als [] Zeit (en) auf. x tritt auf < y Prüft, ob der erste Wert in der Spalte kleiner als die angegebene Häufigkeit ist.
[] tritt mehr als [] Zeit (en) auf x tritt auf > y Prüft, ob der erste Wert in der Spalte mehr als die angegebene Anzahl von Vorkommen enthält.

Diese Prüfungen implizieren die Berechnung von Berechnungen für die Quellenspalten. Solche Operationen können viel länger ausgeführt werden als Prüfungen, bei denen nur einzelne Datensätze getestet werden.

Operationen

Kombinieren Sie Operationselemente mit Prüflogik. Sie verwenden Variablen und Literale, allgemeine Elemente, Datums-und Zeitelemente, mathematische Elemente und Zeichenfolgeelemente mit Operationselementen.

Tabelle 6. Operationen
Element Beschreibung
x + j Addiert den ersten Wert zum zweiten Wert.
x - j Subtrahiert den zweiten Wert vom ersten Wert.
x * j Multipliziert die angegebenen Werte.
x / j Dividiert die angegebenen Werte.
x % j Verwendet die erste Zahl als Dividend und die zweite Zahl als Divisor. Der Modulo ist der Rest aus der Division der ersten Zahl durch die zweite Zahl. Beispiel: 7 % 2 wird mit 1 berechnet.
x ^ j Der Exponentialwert einer Zahl. Beispiel: 5 ^ 3 erhöht 5 auf die dritte Potenz (oder 555), was 125 entspricht.

Datum und Uhrzeit

Sie können Datums-und Zeitelemente mit Prüflogik kombinieren.

Gültige Datumsformate

Kein Begrenzer Gedankenstrich als Begrenzer Schrägstrich als Begrenzer Punkt als Begrenzer
%yyyy%mm%dt %yyyy-%mm-%dt %yyyy/%mm/%dt %yyyy. %mm%dt
%yy%mm%dt %jj-%mm-%tt %yy/%mm/%d %yy. %mm%dt
%mm%dtt%yyyy %mm-%dt-%yyyy %mm/%dt/%yyyy %mm.%dd.%yyyy
%mm%dd%yy %mm-%tt-%jj %mm/%dt/%yy %mm.%d. %yy
%jjjj%dd%mm %jjjj-%tt-%mm %yyyy/%dt/%mm %yyyy.%dd. %mm
%yy%dd%mm %jj-%tt-%mm %yy/%dt/%mm %yy.%dd. %mm
%dtt%mm%yyyy %dt-%mm-%yyyy %dt/%mm/%yyyy %d. %mm.%yyyy
%dd%mm%yy %tt-%mm-%jj %dt/%mm/%yy %d. %mm.%yy

Konvertierungen

Tabelle 7. Konvertierungen
Element Ausdruck Beschreibung
[] aus Format [] in ein anderes Format [] konvertieren convertdate (x, y, z) Konvertiert den ersten Wert aus dem angegebenen Quellenformat in das angegebene Zielformat.
[] in gregorianisches Datum konvertieren julianDayToGregorian(x) Konvertiert das angegebene Datum im julianischen Format in das gregorianische Format.
[] in julianisches Format konvertieren gregorianToJulianDay(x) Konvertiert das angegebene Datum im gregorianischen Format in das julianische Format.
[] mit Format [] in Datum konvertieren datevalue (x,y) Konvertiert den ersten Wert in ein Datum mit dem angegebenen Format.
[] in Zeit konvertieren mit Format [] timevalue (x,y) Konvertiert den ersten Wert in eine Zeit mit dem angegebenen Format.
[] in Zeitmarke mit Format [] konvertieren timestampvalue (x,y) Konvertiert den ersten Wert in eine Zeitmarke unter Verwendung des angegebenen Formats.

Formatierung

Tabelle 8. Formatierung
Element Ausdruck Beschreibung
aktuelles Datum Datum () Gibt das Systemdatum des Computers als Datumswert zurück.
Aktuelle Zeit Zeit () Gibt die Systemzeit des Computers als Zeitwert zurück.
aktuelle Zeitmarke timestamp () Gibt die Systemzeit des Computers als Zeitmarkenwert zurück.
Jahr des Datums [] Jahr (x) Gibt eine Zahl zurück, die das Jahr für das angegebene Datum darstellt.
Monat des Datums [] Monat (x) Gibt eine Zahl zurück, die den Monat für das angegebene Datum darstellt
Tag des Datums [] Tag (x) Gibt eine Zahl zurück, die den Tag des Monats für das angegebene Datum darstellt.
Wochentag für Datum [] Wochentag (x) Gibt eine Zahl zurück, die den Wochentag für das angegebene Datum darstellt, wobei 1 Sonntag ist.
Stunde der Zeit [] Stunden (x) Gibt eine Zahl zurück, die die Stunden für den angegebenen Zeitwert darstellt.
Minuten der Zeit [] Minuten (x) Gibt eine Zahl zurück, die die Minuten für den angegebenen Zeitwert darstellt.
Sekunden [] Sekunden (x) Gibt eine Zahl zurück, die die Sekunden und Millisekunden für den angegebenen Zeitwert darstellt.

Funktionen

Tabelle 9. Funktionen
Element Ausdruck Beschreibung
[] Monate zum Datum hinzufügen [] addmonthsdate (x, y) Fügt die angegebene Anzahl von Monaten zum angegebenen Datum hinzu.
[] Monate zu Zeitmarke [] hinzufügen addmonthstimestamp (x, y) Fügt die angegebene Anzahl von Monaten zur angegebenen Zeitmarke hinzu
Anzahl der Tage zwischen Datum [] und [] datediff (x, y) Gibt die Anzahl der Tage zwischen den beiden angegebenen Datumsangaben zurück
Rundendatum [] mit Format [] round_date (x, y) Rundet den Datumswert unter Verwendung des angegebenen Formats.
Runde Zeit [] im Format [] round_time (x, y) Rundet den Zeitwert unter Verwendung des angegebenen Formats.
Runde Zeitmarke mit Format [] round_timestamp (x, y) Rundet den Zeitmarkenwert unter Verwendung des angegebenen Formats.
Zeitdifferenz zwischen Zeiten [] und [] timediff (x, y) Gibt die Differenz zwischen den beiden angegebenen Zeiten in Stunden, Minuten und Sekunden zurück. Dabei ist der erste Wert die frühere der beiden Uhrzeiten. Der zweite Wert ist die spätere der beiden Uhrzeiten. Der zurückgegebene Wert ist ein Zeitwert.
Datum abschneiden [] mit Format [] trunc_date (x, y) Schneidet das Datum unter Verwendung des angegebenen Formats ab. Der erste Wert muss eine (an eine Spalte des Typs 'Datum' gebundene) Variable sein oder ein Ausdruck bzw. eine Funktion, der/die ein Datum zurückgibt. Der Formatwert muss entweder ein Zeichenfolgeliteral mit einem Zeichenfolgeformat sein oder eine Variable, die an eine Zeichenfolgespalte oder einen Zeichenfolgeliteralwert gebunden ist.
Zeit abschneiden [] im Format [] trunc_time (x, y) Schneidet die Zeit unter Verwendung des angegebenen Formats ab. Der erste Wert muss eine (an eine Spalte des Typs 'Uhrzeit' gebundene) Variable sein oder ein Ausdruck bzw. eine Funktion, der/die eine Uhrzeit zurückgibt. Der Formatwert muss entweder ein Zeichenfolgeliteral mit einem Zeichenfolgeformat sein oder eine Variable, die an eine Zeichenfolgespalte oder einen Zeichenfolgeliteralwert gebunden ist.
Zeitmarke abschneiden [] unter Verwendung des Formats [] trunc_timestamp (x, y) Schneidet die Zeitmarke unter Verwendung des angegebenen Formats ab. Der erste Wert muss entweder eine Variable (die an eine Spalte des Typs 'timestamp' gebunden sein muss) oder ein Ausdruck oder eine Funktion sein, die eine Zeitmarke zurückgibt. Der Formatwert muss entweder ein Zeichenfolgeliteral mit einem Zeichenfolgeformat sein oder eine Variable, die an eine Zeichenfolgespalte oder einen Zeichenfolgeliteralwert gebunden ist.

Allgemein

Sie können allgemeine Elemente mit Prüfungen, Operationen und mathematischen Elementen, Zeichenfolgeelementen sowie Datums-und Zeitelementen kombinieren.

Tabelle 10. Allgemein
Element Ausdruck Beschreibung
Datenklassen, die mit [] übereinstimmen dataclassesof (x) Sucht Datenklassen in Ihren Daten, die der angegebenen Datenklasse entsprechen. Bei diesem Wert handelt es sich normalerweise um eine Variable, die an eine Spalte mit zu klassifizierenden Werten gebunden ist.
Häufigkeit von [] Vorkommen (x) Sucht die Häufigkeit des angegebenen Werts.
lookup [] aus Referenzschlüssel [] und Referenzwert [] Suche (x, y, z) Ersetzt einen Wert durch den entsprechenden Wert in einer Referenztabelle. Zum Ausführen dieser Funktion ist eine Suchtabelle erforderlich, die eine Liste der Werte mit einer entsprechenden Spalte enthält, in der zugehörige Daten für die erste Spalte enthalten sind. Beispiel: Wenn der gesuchte ursprüngliche Wert in einer Spalte vorkommt, die Schlüssel (z. B. Produktcodes) enthält, enthält die zugehörige Suchtabelle eine Spalte mit allen in Frage kommenden Schlüsselwerten und eine andere Spalte mit den entsprechenden Werten, durch die die Schlüssel ersetzt werden sollen. Diese Funktion wird im Allgemeinen in Systemen verwendet, in denen interne Codes verwendet werden, um Werte darzustellen, die an verschiedenen Stellen in Ihren Datenquellen auftreten.
Hinweis: Der erste Parameter der Funktion ist der Wert, nach dem gesucht werden muss. Der zweite Parameter muss an die Referenzspalte der Suchtabelle gebunden sein, in der die Schlüssel enthalten sind. Der dritte Parameter muss an die Referenzspalte mit den Werten in der Suchtabelle gebunden sein. Beide Referenzspalten müssen in derselben physischen Tabelle enthalten sein. Das Ergebnis der Funktion ist der Wert aus der Suchtabelle, der dem im ersten Parameter angegebenen Schlüssel entspricht.
Anzahl der [] -Werte, die nicht null sind, gruppiert nach [] count_not_null (x, y) Sucht die Anzahl der Nullwerte (nicht eindeutige Werte) in einer Spalte. Der erste Wert muss eine Variable enthalten, die an eine zu zählende Spalte gebunden ist. Der zweite Wert gibt eine optionale Gruppierungsspalte an. Wenn die optionale Spalte angegeben ist, gibt die Funktion die Anzahl der Nullwerte in der ersten Spalte für alle Zeilen zurück, in denen die Werte der zweiten Spalte gleich sind.
Anzahl unterschiedlicher Werte von [] gruppiert nach [] count (x, y) Sucht die Anzahl unterschiedlicher Werte in einer Spalte. Der erste Wert muss eine Variable enthalten, die an eine zu zählende Spalte gebunden ist. Der zweite Wert gibt eine optionale Gruppierungsspalte an. Wenn die optionale Spalte angegeben ist, gibt die Funktion die Anzahl der eindeutigen Werte in der ersten Spalte für alle Zeilen zurück, in denen die Werte der zweiten Spalte gleich sind.
Fehlenden Wert für [] durch [] ersetzen coalesce (x, y) Sucht im ersten Wert nach Nullspalten und ersetzt sie durch den zweiten Wert Wenn der erste angegebene Wert ungleich null ist, wird der Wert nicht ersetzt.

Mathematisch

Sie können mathematische Elemente mit Prüflogik kombinieren.

Tabelle 11. Mathematisch
Element Ausdruck Beschreibung
Absoluter Wert von [] abs (x) Gibt den absoluten Wert eines von Ihnen angegebenen numerischen Werts zurück. Beispiel: Als absoluter Wert für [-13] wird 13 zurückgegeben.
Durchschnittswert von [] gruppiert nach [] Durchschnitt (x, y) Eine Aggregatfunktion, die den Durchschnittswert der angegebenen numerischen Spalte nach dem angegebenen Wert gruppiert zurückgibt.
Exponentieller Wert von [] exp (x) Gibt den Exponentialwert des angegebenen numerischen Werts zurück.
Maximalwert von [] gruppiert nach [] max (x, y) Eine Aggregatfunktion, die den Maximalwert zurückgibt, der in der angegebenen numerischen Spalte gefunden wird, gruppiert nach dem angegebenen Wert. Als erster Wert kann eine Spalte bzw. eine Variable angegeben werden (die bei Verwendung der Regel an eine Spalte gebunden sein muss) oder ein Ausdruck, der mindestens eine Variable enthält.
Mindestwert von [] gruppiert nach [] min (x, y) Eine Aggregatfunktion, die den Mindestwert zurückgibt, der in der angegebenen numerischen Spalte gefunden wurde, gruppiert nach dem angegebenen Wert.
Wert normalisieren [] gruppiert nach [] standardize (x, y) Normalisiert die Werte in einer Spalte auf die Anzahl der Standardabweichungen des Werts um den Mittelwert der Spalte. Der normalisierte Wert wird anhand der Formel = (value-mean)/stddev berechnet. Wenn Sie einen Wert für "Gruppiert nach" angeben, wird nicht der Mittelwert/die Standardabweichung verwendet, sondern der Wert aller Werte, die in der Spalte "Gruppieren nach" denselben Wert haben. Wenn eine Spalte beispielsweise einen Mittelwert von 10 und eine Standardabweichung von 2 hat, ist der normalisierte Wert von 12 1.0 (= Mittelwert + 1stddev). Der normalisierte Wert 6 ist -2.0 (=mean-2stddev).
Runde Zahl [], die [] Dezimalstellen beibehält Runde (x, y) Gibt einen gerundeten Wert einer von Ihnen angegebenen Zahl zurück. Der optionale Dezimalparameter gibt die Anzahl der Dezimalstellen rechts vom Dezimalkomma an, auf die gerundet werden soll. Wenn der optionale Parameter nicht angegeben ist, wird keine Dezimalstelle verwendet.
Skala der Zahl [] Maßstab (x*) Gibt die Anzahl der Ziffern rechts vom Dezimalzeichen zurück. Beispiel: Sie möchten die Anzahl der Kommastellen für die Zahl 2,3456789 ermitteln. Die Anzahl der Kommastellen ist 7.
Quadratwurzel von [] sqrt (x) Gibt die Quadratwurzel des angegebenen numerischen Werts zurück.
Standardabweichung von [] gruppiert nach [] stddev (x) Eine Aggregatfunktion, die die Standardabweichung einer von Ihnen angegebenen numerischen Spalte nach dem angegebenen Wert gruppiert berechnet.
Summe von [] gruppiert nach [] Summe (x, y) Eine Aggregatfunktion, die die Summe aller Werte innerhalb der angegebenen numerischen Spalte zurückgibt.
truncate number [] keeping [] Dezimalstellen trunc (x, y) Gibt einen abgeschnittenen Wert der angegebenen Zahl zurück Der Parameter keeping ist der Wert, der abgeschnitten werden soll. Der optionale Dezimalparameter gibt die Anzahl der Stellen rechts vom Dezimalkomma an, die beibehalten werden sollen. Wenn der optionale Parameter nicht angegeben ist, wird keine Dezimalstelle beibehalten.

Zeichenfolge

Sie können Zeichenfolgeelemente mit Prüflogik kombinieren.

Identitäten

Tabelle 12. Identitäten
Element Ausdruck Beschreibung
ASCII-Zeichencode [] ascii (x) Gibt den ASCII-Zeichensatzwert für einen Zeichenwert zurück.
Zeichen mit ASCII-Code [] char (x) Gibt den Zeichenwert für das angegebene ASCII-Zeichen zurück.
concatenate [] mal die Zeichenfolge [] str (x, y) Generiert eine Zeichenfolge, die den angegebenen Wert so oft wie angegeben verkettet. Wenn Sie beispielsweise concatenate [5] times the string [AB]angeben, gibt die Datenqualitätsregel ABABABAB zurück.
Länge von [] Länge (x) Gibt die Gesamtzahl der Zeichen (d. h. die Länge) in der angegebenen Zeichenfolge zurück.
parse [] als Zahl val (x) Nimmt eine Zeichenfolge als Eingabe und versucht, sie als Zahl zu analysieren. Beispiel: Wenn Sie die Zeichenfolge 12,34 angeben, wird als Ergebnis die Zahl 12,34 zurückgegeben.
Position von [] in Zeichenfolge [] index (x, y) Gibt den Index des ersten Vorkommens einer Unterzeichenfolge in einer anderen Zeichenfolge zurück Gibt den Index mit der Basis null der gefundenen Vorkommen zurück oder den Wert -1, wenn die Teilzeichenfolge nicht gefunden wird.

Änderungen

Tabelle 13. Änderungen
Element Ausdruck Beschreibung
[] in Zeichenfolge mit Format [] konvertieren tostring (x, y) Konvertiert den angegebenen Wert in eine Zeichenfolge im angegebenen Format.
erste [] Zeichen von [] links (x, y) Gibt die ersten n Zeichen der angegebenen Zeichenfolge zurück, wobei n die Anzahl der zurückzugebenden Zeichen ist.
letzte [] Zeichen von [] rechts (x, y) Gibt die letzten n Zeichen der angegebenen Zeichenfolge zurück, wobei n die Anzahl der zurückzugebenden Zeichen ist.
Kleinbuchstaben von [] lcase (x) Konvertiert alle Zeichen in der angegebenen Zeichenfolge in Kleinbuchstaben.
Unterzeichenfolge von [] ab Position [] und Länge [] substring (x, y, z) Gibt eine Unterzeichenfolge der angegebenen Zeichenfolge ab der angegebenen Position und mit der angegebenen Länge zurück. Der als Anfangsposition angegebene Wert ist der Index des ersten Zeichens, das abgerufen werden soll (einschließliche Angabe). 1 ist der Index des ersten Zeichens in der Zeichenfolge. Beispiel: Sie möchten drei Stellen (die Zeichen an der vierten, fünften und sechsten Position) aus jedem Produktcode verwenden, um zu ermitteln, welche Abteilung für das Produkt zuständig ist.
Großbuchstaben von [] ucase (x) Konvertiert alle Zeichen in der angegebenen Zeichenfolge in Großbuchstaben.

Auffüllung

Tabelle 14. Auffüllung
Element Ausdruck Beschreibung
add [] Leerzeichen nach [] rpad (x, y) Fügt die angegebene Anzahl Leerzeichen nach der angegebenen Zeichenfolge hinzu.
add [] Leerzeichen vor und [] Leerzeichen nach [] Block (x, y, z) Fügt die angegebene Anzahl von Leerzeichen vor und nach der angegebenen Zeichenfolge hinzu
insert [] Leerzeichen vor [] lpad (x, y) Fügt die angegebene Anzahl Leerzeichen am Anfang der angegebenen Zeichenfolge hinzu.

Trimmen

Tabelle 15. Trimmen
Element Ausdruck Beschreibung
Linke Trimmung von [] ltrim (x) Entfernt alle Leerzeichen am Anfang der angegebenen Zeichenfolge.
Rechter Ausschnitt [] rtrim (x) Entfernt alle Leerzeichen am Ende der angegebenen Zeichenfolge.
Trimmen [] Trimmen (x) Entfernt alle Leerzeichen am Anfang und Ende der angegebenen Zeichenfolge.

Weitere Informationen

Übergeordnetes Thema: Datenqualitätsdefinitionen verwalten