Zurück zur englischen Version der DokumentationString-Funktionen
Zeichenfolgefunktionen (SPSS Modeler)
Letzte Aktualisierung: 20. Dez. 2024
Mit CLEM können Sie Operationen ausführen, um Zeichenfolgen zu vergleichen, Zeichenfolgen zu erstellen oder auf Zeichen zuzugreifen.
In CLEM ist eine Zeichenfolge eine beliebige Zeichenfolge zwischen übereinstimmenden Anführungszeichen ("string quotes"
). Zeichen (CHAR
) können ein beliebiges alphanumerisches Zeichen sein. Sie werden in CLEM-Ausdrücken mit einfachen hinteren Anführungszeichen in Form von `<character>`
deklariert, z. B. `z`
, `A`
oder `2`
. Zeichen, die außerhalb des zulässigen Bereichs liegen, oder negative Indizes bei einer Zeichenfolge führen zu einem undefinierten Verhalten.
Hinweis: Vergleiche zwischen Zeichenfolgen, die SQL-Pushback verwenden und nicht verwenden, können unterschiedliche Ergebnisse generieren, wenn nachgestellte Leerzeichen vorhanden sind.
Funktion | Ergebnis | Beschreibung |
---|---|---|
allbutfirst(N, STRING) |
Zeichenfolge | Gibt eine Zeichenfolge zurück, die STRING ist, wobei die ersten N Zeichen entfernt werden. |
allbutlast(N, STRING) |
Zeichenfolge | Gibt eine Zeichenfolge zurück, die STRING ist, wobei die letzten Zeichen entfernt wurden. |
alphabefore(STRING1, STRING2) |
Boolesch | Dient zur Überprüfung der alphabetischen Sortierung von Zeichenfolgen. Gibt 'true' zurück, wenn STRING1 vor STRING2 steht. |
count_substring(STRING, SUBSTRING) |
Ganze Zahl | Ergibt den Wert, wie oft die angegebene Teilzeichenfolge in der Zeichenfolge auftritt. Beispiel: count_substring("foooo.txt", "oo") gibt 3 zurück. |
endstring(LENGTH, STRING) |
Zeichenfolge | Extrahiert die letzten N Zeichen aus der angegebenen Zeichenfolge. Ist eine Zeichenfolge kleiner-gleich der angegebenen Länge, dann bleibt die Zeichenfolge unverändert. |
hasendstring(STRING, SUBSTRING) |
Ganze Zahl | Diese Funktion entspricht isendstring(SUBSTRING, STRING) . |
hasmidstring(STRING, SUBSTRING) |
Ganze Zahl | Diese Funktion entspricht ismidstring(SUBSTRING, STRING) (eingebettete Unterzeichenfolge). |
hasstartstring(STRING, SUBSTRING) |
Ganze Zahl | Diese Funktion entspricht isstartstring(SUBSTRING, STRING) . |
hassubstring(STRING, N, SUBSTRING) |
Ganze Zahl | Diese Funktion entspricht issubstring(SUBSTRING, N, STRING) , wobei N standardmäßig den Wert 1 annimmt. |
hassubstring(STRING, SUBSTRING) |
Ganze Zahl | Diese Funktion entspricht issubstring(SUBSTRING, 1, STRING) , wobei N standardmäßig den Wert 1 annimmt. |
isalphacode(CHAR) |
Boolesch | Gibt den Wert 'true' zurück, wenn CHAR ein Zeichen in der angegebenen Zeichenfolge (häufig ein Feldname) ist, dessen Zeichencode ein Buchstabe ist. Andernfalls gibt diese Funktion den Wert 0 zurück. Zum Beispiel isalphacode(produce_num(1)) . |
isendstring(SUBSTRING, STRING) |
Ganze Zahl | Wenn die Zeichenfolge STRING mit der Unterzeichenfolge SUBSTRING endet, gibt diese Funktion den ganzzahligen Index SUBSTRING in STRING zurück. Andernfalls gibt diese Funktion den Wert 0 zurück. |
islowercode(CHAR) |
Boolesch | Gibt den Wert true zurück, wenn CHAR ein Kleinbuchstaben für die angegebene Zeichenfolge ist (häufig ein Feldname). Andernfalls gibt diese Funktion den Wert 0 zurück. Beispielsweise sind sowohl islowercode(``) als auch islowercode(country_name(2)) gültige Ausdrücke. |
ismidstring(SUBSTRING, STRING) |
Ganze Zahl | Wenn SUBSTRING eine Unterzeichenfolge von STRING ist, aber nicht mit dem ersten Zeichen von STRING beginnt oder mit dem letzten Zeichen endet, gibt diese Funktion das Subskript zurück, bei dem die Unterzeichenfolge beginnt. Andernfalls gibt diese Funktion den Wert 0 zurück. |
isnumbercode(CHAR) |
Boolesch | Gibt den Wert 'true' zurück, wenn CHAR für die angegebene Zeichenfolge (häufig ein Feldname) ein Zeichen ist, dessen Zeichencode eine Ziffer ist. Andernfalls gibt diese Funktion den Wert 0 zurück. Zum Beispiel isnumbercode(product_id(2)) . |
isstartstring(SUBSTRING, STRING) |
Ganze Zahl | Wenn die Zeichenfolge STRING mit der Unterzeichenfolge SUBSTRING beginnt, gibt diese Funktion den Index 1 zurück. Andernfalls gibt diese Funktion den Wert 0 zurück. |
issubstring(SUBSTRING, N, STRING) |
Ganze Zahl | Durchsucht die Zeichenfolge STRING ab ihrem Nth -Zeichen nach einer Unterzeichenfolge, die der Zeichenfolge SUBSTRING entspricht. Wenn die Teilzeichenfolge gefunden wird, ergibt diese Funktion den Index, bei dem die Teilzeichenfolge beginnt. Andernfalls gibt diese Funktion den Wert 0 zurück. Wenn N nicht angegeben ist, nimmt diese Funktion standardmäßig den Wert 1 an. |
issubstring(SUBSTRING, STRING) |
Ganze Zahl | Durchsucht die Zeichenfolge STRING . Wenn die Teilzeichenfolge gefunden wird, ergibt diese Funktion den Index, bei dem die Teilzeichenfolge beginnt. Andernfalls gibt diese Funktion den Wert 0 zurück. |
issubstring_count(SUBSTRING, N, STRING) |
Ganze Zahl | Gibt den Index des Nth -Vorkommens von SUBSTRING in der angegebenen STRING zurück. Sind weniger als N Vorkommen von SUBSTRING vorhanden, wird 0 zurückgegeben. |
issubstring_lim(SUBSTRING, N, STARTLIM, ENDLIM, STRING) |
Ganze Zahl | Diese Funktion ist dieselbe wie issubstring , aber die Übereinstimmung ist auf den Start unter STARTLIM und auf das Ende unter ENDLIM beschränkt. Die Einschränkungen STARTLIM oder ENDLIM können inaktiviert werden, indem für jedes Argument der Wert ' false' angegeben wird. Beispiel: issubstring_lim(SUBSTRING, N, false, false,
STRING) ist mit issubstring identisch. |
isuppercode(CHAR) |
Boolesch | Gibt den Wert 'true' zurück, wenn CHAR ein Großbuchstabe ist. Andernfalls gibt diese Funktion den Wert 0 zurück. Beispielsweise sind sowohl isuppercode(``) als auch isuppercode(country_name(2)) gültige Ausdrücke. |
last(STRING) |
Zeichenfolge | Gibt das letzte Zeichen CHAR von STRING zurück (das mindestens ein Zeichen lang sein muss. |
length(STRING) |
Ganze Zahl | Gibt die Länge der Zeichenfolge STRING (d. h. die Anzahl der Zeichen in dieser Zeichenfolge) aus. |
locchar(CHAR, N, STRING) |
Ganze Zahl | Mit dieser Funktion kann die Position der Zeichen in symbolischen Feldern ermittelt werden. Die Funktion durchsucht die Zeichenfolge STRING nach dem Zeichen CHAR , wobei die Suche beim Zeichen Nth von STRING beginnt. Diese Funktion ergibt einen Wert (mit Startwert N ), der die Position angibt, an der das Zeichen gefunden wurde. Wenn das Zeichen nicht gefunden wird, gibt diese Funktion den Wert 0 zurück. Wenn die Funktion einen ungültigen Offset (N) hat (z. B. ein Offset, der über die Länge der Zeichenfolge hinausgeht), gibt diese Funktion $null$ zurück. Beispiel: locchar(`n`, 2,
web_page) sucht im Feld web_page nach dem Zeichen `n` , das mit dem zweiten Zeichen im Feldwert beginnt. Stellen Sie sicher, dass Sie einzelne Back-Anführungszeichen verwenden, um das angegebene Zeichen einzukapseln. |
locchar_back(CHAR, N, STRING) |
Ganze Zahl | Ähnlich wie locchar , mit der Ausnahme, dass die Suche rückwärts ab dem Zeichen Nth ausgeführt wird. Beispiel: locchar_back(`n`, 9,
web_page) durchsucht das Feld web_page beginnend beim neunten Zeichen und rückwärts zum Anfang der Zeichenfolge. Wenn die Funktion ein ungültiges Offset aufweist, (z. B. ein Offset, das außerhalb der Länge der Zeichenfolge liegt), ergibt die Funktion $null$ . Idealerweise sollten Sie locchar_back in Verbindung mit der Funktion length(<field>) verwenden, um die Länge des aktuellen Werts des Felds dynamisch zu nutzen. Beispiel: locchar_back(`n`, (length(web_page)), web_page) . |
lowertoupper(CHAR) lowertoupper (STRING) |
CHAR oder Zeichenfolge | Die Eingabe kann entweder eine Zeichenfolge oder ein Zeichen sein. Diese wird in dieser Funktion verwendet, um ein neues Element desselben Typs auszugeben, wobei alle Kleinbuchstaben in ie entsprechenden Großbuchstaben konvertiert wurden. Z. B. sind lowertoupper(`a`) , lowertoupper(“My string”) und lowertoupper(field_name(2)) gültige Ausdrücke. |
matches |
Boolesch | Gibt true zurück, wenn eine Zeichenfolge einem angegebenen Muster entspricht. Das Muster muss ein Zeichenfolgeliteral sein; es darf kein Feldname sein, der ein Muster enthält. Sie können im Muster ein Fragezeichen (? ) angeben, um genau ein Zeichen abzugleichen. Ein Stern (* ) entspricht null oder mehr Zeichen. Verwenden Sie für eine Übereinstimmung mit einem Literalfragezeichen oder einem Stern (anstatt diese als Platzhalterzeichen zu verwenden) einen Backslash (\ ) als Escapezeichen. |
replace(SUBSTRING, NEWSUBSTRING, STRING) |
Zeichenfolge | Ersetzen Sie innerhalb der angegebenen STRING alle Instanzen von SUBSTRING durch NEWSUBSTRING . |
replicate(COUNT, STRING) |
Zeichenfolge | Ergibt eine Zeichenfolge, die aus der ursprünglichen Zeichenfolge besteht, die so oft wie angegeben kopiert wurde. |
stripchar(CHAR,STRING) |
Zeichenfolge | Mit dieser Funktion können Sie die angegebenen Zeichen aus einer Zeichenfolge oder einem Feld entfernen. Mit dieser Funktion können Sie beispielsweise zusätzliche Symbole, wie Währungsangaben, aus den Daten entfernen, um eine einfache Zahl oder einen einfachen Namen zu erhalten. Z. B. wird bei der Verwendung der Syntax stripchar(`$`, 'Cost') ein neues Feld ausgegeben, bei dem die Dollarzeichen aus allen Werten entfernt wurden. Stellen Sie sicher, dass Sie einzelne Back-Anführungszeichen verwenden, um das angegebene Zeichen einzukapseln. |
skipchar(CHAR, N, STRING) |
Ganze Zahl | Durchsucht die Zeichenfolge STRING nach anderen Zeichen als CHAR , beginnend mit dem Zeichen Nth . Diese Funktion gibt eine ganzzahlige Unterzeichenfolge zurück, die den Punkt angibt, an dem eine gefunden wird, oder 0 , wenn jedes Zeichen ab Nth ein CHAR ist. Wenn die Funktion ein ungültiges Offset aufweist, (z. B. ein Offset, das außerhalb der Länge der Zeichenfolge liegt), ergibt die Funktion $null$ . locchar wird häufig zusammen mit den skipchar -Funktionen verwendet, um den Wert von N zu bestimmen (der Punkt, an dem die Suche nach der Zeichenfolge beginnen soll). Beispiel: skipchar(`s`, (locchar(`s`, 1,
"MyString")), "MyString") . |
skipchar_back(CHAR, N, STRING) |
Ganze Zahl | Ähnlich wie skipchar , mit der Ausnahme, dass die Suche rückwärts ausgeführt wird, beginnend mit dem Zeichen Nth . |
startstring(N, STRING) |
Zeichenfolge | Extrahiert die ersten N Zeichen aus der angegebenen Zeichenfolge. Ist eine Zeichenfolge kleiner-gleich der angegebenen Länge, dann bleibt die Zeichenfolge unverändert. |
strmember(CHAR, STRING) |
Ganze Zahl | Äquivalent zu locchar(CHAR, 1, STRING) . Sie gibt eine ganzzahlige Unterzeichenfolge zurück, die den Punkt angibt, an dem CHAR zum ersten Mal auftritt, oder 0 . Wenn die Funktion ein ungültiges Offset aufweist, (z. B. ein Offset, das außerhalb der Länge der Zeichenfolge liegt), ergibt die Funktion $null$ . |
subscrs(N, STRING) |
char | Gibt das Nth Zeichen CHAR der Eingabezeichenfolge STRING zurück. Diese Funktion kann auch in Kurzform als STRING(N) geschrieben werden. Z. B. ist lowertoupper(“name”(1)) ein gültiger Ausdruck. |
substring(N, LEN, STRING) |
Zeichenfolge | Gibt eine Zeichenfolge SUBSTRING zurück, die aus den LEN Zeichen der Zeichenfolge STRING besteht, beginnend mit dem Zeichen beim Subskript N. |
substring_between(N1, N2, STRING) |
Zeichenfolge | Gibt die Unterzeichenfolge von STRING zurück, die bei Subskript N1 beginnt und bei Subskript N2 endet. |
textsplit(STRING, N, CHAR) |
Zeichenfolge | textsplit(STRING,N,CHAR) gibt die Unterzeichenfolge zwischen dem Vorkommen von Nth-1 und Nth von CHAR zurück. Wenn N auf 1 gesetzt ist, wird die Unterzeichenfolge vom Anfang von STRING bis einschließlich CHAR zurückgegeben. Wenn N-1 das letzte Vorkommen von CHAR ist, wird die Unterzeichenfolge vom Nth-1 Vorkommen von CHAR bis zum Ende der Zeichenfolge zurückgegeben. |
trim(STRING) |
Zeichenfolge | Entfernt führende und nachgestellte Leerzeichen aus der angegebenen Zeichenfolge. |
trimstart(STRING) |
Zeichenfolge | Entfernt führende Leerzeichen aus der angegebenen Zeichenfolge. |
trimend(STRING) |
Zeichenfolge | Entfernt nachgestellte Leerzeichen aus der angegebenen Zeichenfolge. |
unicode_char(NUM) |
char | Die Eingabe muss aus Dezimalwerten, nicht Hexadezimalwerten, bestehen. Gibt das Zeichen mit dem Unicode-Wert NUM zurück. |
unicode_value(CHAR) |
ZAHL | Gibt den Unicode-Wert von CHAR zurück. |
uppertolower(CHAR) uppertolower (STRING) |
CHAR oder Zeichenfolge | Die Eingabe kann entweder eine Zeichenfolge oder ein Zeichen sein. Diese wird in dieser Funktion verwendet, um ein neues Element desselben Typs auszugeben, wobei alle Großbuchstaben in die entsprechenden Kleinbuchstaben konvertiert wurden. Achten Sie darauf, Zeichenfolgen mit doppelten Anführungszeichen und Zeichen mit einfachen Back-Anführungszeichen anzugeben. Einzelne Feldnamen sollten ohne Anführungszeichen angegeben werden. |