0 / 0
Go back to the English version of the documentation
Metadane danych
Last updated: 04 lip 2023
Metadane danych (SPSS Modeler)

W tej sekcji opisano sposób konfigurowania atrybutów modelu danych w oparciu o obiekty pyspark.sql.StructField.

Obiekty spss.datamodel.Role

Ta klasa wylicza poprawne role dla każdej zmiennej w modelu danych.

BOTH: wskazuje, że ta zmienna może być poprzednikiem lub następnikiem.

FREQWEIGHT: wskazuje, że to pole ma być używane jako waga częstotliwości. Ta wartość nie jest wyświetlana użytkownikowi.

INPUT: wskazuje, że ta zmienna jest predyktorem lub poprzednikiem.

NONE: wskazuje, że ta zmienna nie jest używana bezpośrednio podczas modelowania.

TARGET: wskazuje, że ta zmienna jest przewidywana lub jest następnikiem.

PARTITION: wskazuje, że to pole identyfikuje partycję danych.

RECORDID: wskazuje, że ten identyfikator jest identyczny z identyfikatorem rekordu.

SPLIT: wskazuje, że to pole powoduje rozdziel danych.

Obiekty spss.datamodel.Measure

Ta klasa wylicza poziomy pomiaru dla zmiennych w modelu danych.

UNKNOWN: wskazuje, że typ pomiaru jest nieznany.

CONTINUOUS: wskazuje, że typ pomiaru jest ciągły.

NOMINAL: wskazuje, że typ pomiaru jest nominalny.

FLAG: wskazuje, że wartość zmiennej jest jedną z dwóch wartości.

DISCRETE: wskazuje, że wartość zmiennej powinna być interpretowana jako kolekcja wartości.

ORDINAL: wskazuje, że typ pomiaru jest porządkowy.

TYPELESS: wskazuje, że zmienna może mieć dowolną wartość zgodną z jej formatem przechowywania.

Obiekty pyspark.sql.StructField

Reprezentuje zmienną w StructType. Obiekt StructField składa się z czterech pól:
  • name (string): nazwa StructField
  • dataType (pyspark.sql.DataType): konkretny typ danych
  • nullable (bool): czy wartości StructField mogą zawierać wartości None
  • metadata (dictionary): słownik python, w którym przechowywane są atrybuty opcji
Istnieje możliwość użycia instancji słownika metadanych do przechowywania atrybutu pomiaru, roli lub etykiety dla konkretnej zmiennej. Słowami kluczowymi dla tych atrybutów są:
  • measure: słowo kluczowe atrybutu measure
  • role: słowo kluczowe atrybutu role
  • displayLabel: słowo kluczowe atrybutu label
Przykład:
from spss.datamodel.Role import Role
from spss.datamodel.Measure import Measure
_metadata = {}
_metadata['measure'] = Measure.TYPELESS
_metadata['role'] = Role.NONE
_metadata['displayLabel'] = "field label description"
StructField("userName", StringType(), nullable=False, 
metadata=_metadata)
Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more