0 / 0
Torna alla versione inglese della documentazione
Metadati di dati
Ultimo aggiornamento: 07 ott 2024
Metadati di dati (SPSS Modeler)

Questa sezione descrive in che modo configurare gli attributi del modello di dati in base a pyspark.sql.StructField.

Oggetti spss.datamodel.Role

Questa classe enumera i ruoli validi per ogni campo in un modello di dati.

BOTH: Indica che questo campo può essere un antecedente o un conseguente.

FREQWEIGHT: Indica che questo campo deve essere utilizzato come un peso frequenza; non viene visualizzato all'utente.

INPUT: Indica che questo campo è un predittore o un antecedente.

NONE: Indica che questo campo non viene utilizzato direttamente durante la modellazione.

TARGET: Indica che questo campo è predittivo o un conseguente

PARTITION: Indica che questo campo identifica la partizione dati.

RECORDID: Indica che questo campo identifica l'ID record.

SPLIT: Indica che questo campo suddivide i dati.

Oggetti spss.datamodel.Measure

Questa classe enumera i livelli di misurazione per i campi in un modello dati.

UNKNOWN: Indica che questo tipo di misura è sconosciuto.

CONTINUOUS: Indica che questo tipo di misura è continuo.

NOMINAL: Indica che questo tipo di misura è nominale.

FLAG: Indica che il valore del campo è uno di due valori.

DISCRETE: Indica che il valore del campo deve essere interpretato come una raccolta di valori.

ORDINAL: Indica che il tipo di misura è ordinale.

TYPELESS: Indica che il campo può avere un valore compatibile con la relativa archiviazione.

Oggetti pyspark.sql.StructField

Rappresenta un campo in un StructType. Un oggetto StructField comprime quattro campi:
  • name (string): nome di un StructField
  • dataType (pyspark.sql.DataType): tipo di dati specifico
  • nullable (bool): se i valori di StructField può contenere i valori None
  • metadata (dictionary): un dizionario python che memorizza gli attributi dell'opzione.
È possibile utilizzare l'istanza del dizionario di metadati per archiviare l'attributo measure, role o label per il campo specifico. Le parole chiavi per questi attributi sono:
  • measure: la parola chiave per l'attributo measure
  • role: la parola chiave per l'attributo role
  • displayLabel: la parola chiave per l'attributo label
Esempio:
from spss.datamodel.Role import Role
from spss.datamodel.Measure import Measure
_metadata = {}
_metadata['measure'] = Measure.TYPELESS
_metadata['role'] = Role.NONE
_metadata['displayLabel'] = "field label description"
StructField("userName", StringType(), nullable=False, 
metadata=_metadata)
Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni