資料の 英語版 に戻る
データ・メタデータ (SPSS Modeler)
データのメタデータ
最終更新: 2025年2月11日
このセクションでは、
に基づいてデータ モデルの属性を設定する方法について説明します。pyspark.sql.StructField
spss.datamodel.Role オブジェクト
このクラスは、データ モデル内の各フィールドの有効な役割を列挙します。
: このフィールドは、前提条件にすることも、結果にすることもできます。BOTH
: このフィールドは、度数の重みとして使用されます。これは、ユーザーには表示されません。FREQWEIGHT
: このフィールドは、予測値または前提条件のいずれかになります。INPUT
: モデルの作成時に、このフィールドが直接使用されることはありません。NONE
: このフィールドは、予測値または結果のいずれかになります。TARGET
: このフィールドにより、データ・パーティションが識別されます。PARTITION
: このフィールドにより、レコード ID が識別されます。RECORDID
: このフィールドにより、データが分割されます。SPLIT
spss.datamodel.Measure オブジェクト
このクラスは、データ モデル内の各フィールドの尺度を列挙します。
: 不明な型の尺度であることを示します。UNKNOWN
: 連続型の尺度であることを示します。CONTINUOUS
: 名義型の尺度であることを示します。NOMINAL
: フィールド値が 2 つの値のいずれかであることを示します。FLAG
: フィールド値を値のセットとして解釈する必要があることを示します。DISCRETE
: 順序型の測定タイプであることを示します。ORDINAL
: フィールドのストレージに対応する値であれば、任意の値をそのフィールドに設定することができます。TYPELESS
pyspark.sql.StructField オブジェクト
StructType
内のフィールドを表します。 StructField
オブジェクトは、以下に示す 4 つのフィールドから構成されます。
:name (string)
の名前StructField
: 特定のデータ型dataType (pyspark.sql.DataType)
:nullable (bool)
の値にStructField
の値を格納できるかどうかNone
: オプションの属性を保管する Python ディクショナリーmetadata (dictionary)
メタデータのディクショナリー・インスタンスを使用すると、特定のフィールドについて、尺度、役割、ラベルの属性を保管することができます。 これらの属性のキーワードを以下に示します。
:measure
属性のキーワードmeasure
:role
属性のキーワードrole
:displayLabel
属性のキーワードlabel
例:
from spss.datamodel.Role import Role from spss.datamodel.Measure import Measure _metadata = {} _metadata['measure'] = Measure.TYPELESS _metadata['role'] = Role.NONE _metadata['displayLabel'] = "field label description" StructField("userName", StringType(), nullable=False, metadata=_metadata)
トピックは役に立ちましたか?
0/1000