Translation not up to date
W tej sekcji opisano sposób konfigurowania atrybutów modelu danych w oparciu o obiekty pyspark.sql.StructField
.
Obiekty spss.datamodel.Role
Ta klasa wylicza poprawne role dla każdej zmiennej w modelu danych.
BOTH
: wskazuje, że ta zmienna może być poprzednikiem lub następnikiem.
FREQWEIGHT
: wskazuje, że to pole ma być używane jako waga częstotliwości. Ta wartość nie jest wyświetlana użytkownikowi.
INPUT
: wskazuje, że ta zmienna jest predyktorem lub poprzednikiem.
NONE
: wskazuje, że ta zmienna nie jest używana bezpośrednio podczas modelowania.
TARGET
: wskazuje, że ta zmienna jest przewidywana lub jest następnikiem.
PARTITION
: wskazuje, że to pole identyfikuje partycję danych.
RECORDID
: wskazuje, że ten identyfikator jest identyczny z identyfikatorem rekordu.
SPLIT
: wskazuje, że to pole powoduje rozdziel danych.
Obiekty spss.datamodel.Measure
Ta klasa wylicza poziomy pomiaru dla zmiennych w modelu danych.
UNKNOWN
: wskazuje, że typ pomiaru jest nieznany.
CONTINUOUS
: wskazuje, że typ pomiaru jest ciągły.
NOMINAL
: wskazuje, że typ pomiaru jest nominalny.
FLAG
: wskazuje, że wartość zmiennej jest jedną z dwóch wartości.
DISCRETE
: wskazuje, że wartość zmiennej powinna być interpretowana jako kolekcja wartości.
ORDINAL
: wskazuje, że typ pomiaru jest porządkowy.
TYPELESS
: wskazuje, że zmienna może mieć dowolną wartość zgodną z jej formatem przechowywania.
Obiekty pyspark.sql.StructField
StructType
. Obiekt StructField
składa się z czterech pól:name (string)
: nazwaStructField
dataType (pyspark.sql.DataType)
: konkretny typ danychnullable (bool)
: czy wartościStructField
mogą zawierać wartościNone
metadata (dictionary)
: słownik python, w którym przechowywane są atrybuty opcji
measure
: słowo kluczowe atrybutumeasure
role
: słowo kluczowe atrybuturole
displayLabel
: słowo kluczowe atrybutulabel
from spss.datamodel.Role import Role
from spss.datamodel.Measure import Measure
_metadata = {}
_metadata['measure'] = Measure.TYPELESS
_metadata['role'] = Role.NONE
_metadata['displayLabel'] = "field label description"
StructField("userName", StringType(), nullable=False,
metadata=_metadata)