Questa sezione descrive in che modo configurare gli attributi del modello di dati in base a
pyspark.sql.StructField
.
Oggetti spss.datamodel.Role
Questa classe enumera i ruoli validi per ogni campo in un modello di dati.
BOTH
: Indica che questo campo può essere un antecedente o un conseguente.
FREQWEIGHT
: Indica che questo campo deve essere utilizzato come un peso frequenza; non viene visualizzato all'utente.
INPUT
: Indica che questo campo è un predittore o un antecedente.
NONE
: Indica che questo campo non viene utilizzato direttamente durante la modellazione.
TARGET
: Indica che questo campo è predittivo o un conseguente
PARTITION
: Indica che questo campo identifica la partizione dati.
RECORDID
: Indica che questo campo identifica l'ID record.
SPLIT
: Indica che questo campo suddivide i dati.
Oggetti spss.datamodel.Measure
Questa classe enumera i livelli di misurazione per i campi in un modello dati.
UNKNOWN
: Indica che questo tipo di misura è sconosciuto.
CONTINUOUS
: Indica che questo tipo di misura è continuo.
NOMINAL
: Indica che questo tipo di misura è nominale.
FLAG
: Indica che il valore del campo è uno di due valori.
DISCRETE
: Indica che il valore del campo deve essere interpretato come una raccolta di valori.
ORDINAL
: Indica che il tipo di misura è ordinale.
TYPELESS
: Indica che il campo può avere un valore compatibile con la relativa archiviazione.
Oggetti pyspark.sql.StructField
StructType
. Un oggetto StructField
comprime quattro campi:name (string)
: nome di unStructField
dataType (pyspark.sql.DataType)
: tipo di dati specificonullable (bool)
: se i valori diStructField
può contenere i valoriNone
metadata (dictionary)
: un dizionario python che memorizza gli attributi dell'opzione.
measure
: la parola chiave per l'attributomeasure
role
: la parola chiave per l'attributorole
displayLabel
: la parola chiave per l'attributolabel
from spss.datamodel.Role import Role
from spss.datamodel.Measure import Measure
_metadata = {}
_metadata['measure'] = Measure.TYPELESS
_metadata['role'] = Role.NONE
_metadata['displayLabel'] = "field label description"
StructField("userName", StringType(), nullable=False,
metadata=_metadata)