0 / 0
資料の 英語版 に戻る
データ資産ノード
最終更新: 2024年11月22日
データ資産ノード (SPSS Modeler)

データ・アセット・ノードを使用して、接続を使用するリモート・データ・ソースまたはローカル・コンピューターからデータをプルできます。 最初に、接続を作成する必要があります。

Planning Analytics データベースへの接続では、(キューブではなく) ビューを選択する必要があるので注意してください。

ローカル・データ・ファイルからデータをプルすることもできます (.csv.txt.json.xls.xlsx.sav、および.sasがサポートされています)。 スプレッドシートからデータをプルする場合は、最初のシートだけがインポートされます。 ノード・プロパティーの「データ」で、アップロードするデータ・ファイルを 1 つ以上選択することができます。 ローカル・ファイル・システムからキャンバスにデータ・ファイルをドラッグ・アンド・ドロップすることもできます。

注: SPSS Modeler SubscriptionまたはSPSS Modelerクライアントで作成されたストリーム(.str)を'watsonx.ai Studioにインポートすることができます。 インポートされたストリームに 1 つ以上のインポート・ノードまたはエクスポート・ノードが含まれている場合、ノードの変換を求めるプロンプトが出されます。 SPSS Modelerストリームのインポート」を参照してください。

データ・フォーマット・オプションの設定

国によって、整数の部分と分数の部分を分ける記号は異なる。 例えば、ピリオドの代わりにカンマ(4,5)を使う国もあります(4.5)。 また、国によってデータのフィールドを区切る記号が異なることもある。 たとえば、フィールドを区切るのにカンマを使わず、コロンやタブを使うこともできる。 これらの記号のどれを使うかを指定できる。 ノードをダブルクリックしてそのプロパティーを開き、データ・フォーマットを指定します。
図1: フィールド区切り文字と小数点記号のオプション
フィールド区切り文字と小数点記号のオプション

データ構造の推測

SPSS Modeler は、データ内のレコードのサンプルを処理して、データの構造とデータのタイプを推測します。 最初の 1000 件のレコードが、保有するレコード数に適したサンプルではない場合は、 「レコード・カウントの推測」 の数を調整します。 場合によっては、 SPSS Modeler がデータの構造に関して誤った推論を行うことがあります。 詳しくは、 SPSS Modelerのトラブルシューティングを参照してください。

SPSS Statistics ファイルからデータをインポートする

SPSS Statistics ファイル (.sav) からデータをインポートする場合は、以下のオプションを使用できます。

変数名。 SPSS Statistics .sav ファイルからのインポート時に変数名とラベルを処理する方法を選択します。 ここに含めることを選択したメタデータは、SPSS Modeler での作業全体を通じて保持され、 IBM SPSS Statisticsで使用するために再度エクスポートできます。
  • 名前とラベルを読み取ります。 変数名とラベルの両方を SPSS Modelerに読み込む場合に選択します。 このオプションはデフォルトで有効になっており、データ型ノードに変数名が表示されます。 ラベルは、グラフ、モデル・ブラウザー、およびその他のタイプの出力で表示されます。 デフォルトでは、出力中のラベル表示は無効になっています。
  • ラベルを名前として読み取ります。 短いフィールド名ではなく、 SPSS Statistics .sav ファイルから記述変数ラベルを読み込む場合に選択します。これらのラベルを SPSS Modelerの変数名として使用します。
値: SPSS Statistics .sav ファイルからのインポート時に値とラベルを処理する方法を選択します。 ここで含めることを選択したメタデータは、 SPSS Modeler での作業全体を通して保持され、 SPSS Statisticsで使用するために再度エクスポートすることができます。
  • データとラベルを読み取ります。 実際の値と値ラベルの両方を SPSS Modelerに読み込む場合に選択します。 このオプションはデフォルトで有効になっており、値自体がデータ型ノードに表示されます。 値ラベルは、式ビルダー、グラフ、モデル・ブラウザー、およびその他のタイプの出力に表示されます。
  • ラベルをデータとして読み取ります。 値を表すために使用される数値コードまたはシンボル・コードではなく、 .sav ファイルの値ラベルを使用する場合に選択します。 例えば、 1 および 2 の値が 「男性」 および 「女性」を表す性別フィールドを持つデータに対してこのオプションを選択すると、フィールドがストリングに変換され、実際の値として male および female がインポートされます。

    このオプションを選択する前に、 SPSS Statistics データの欠損値を検討することが重要です。 例えば、数値フィールドで欠損値に対してのみラベルを使用する場合 (0 = 「回答なし」–99 = 「不明」)、 「ラベルをデータとして読み込む」 オプションを選択すると、値ラベル 「回答なし」 および 「不明」 のみがインポートされ、フィールドが文字列に変換されます。 このような場合は、値自体をインポートして、データ型ノードに欠損値を設定する必要があります。

フィールド・フォーマット情報を使用して、ストレージを決定します。 このオプションを選択解除すると、 .sav ファイルで整数としてフォーマット設定されているフィールド値 ( IBM SPSS Statisticsの変数ビューで Fn.0 として指定されているフィールドなど) が、整数ストレージを使用してインポートされます。 文字列を除くすべてのフィールド値は、実数としてインポートされます。

このオプションを選択すると (デフォルト)、.savファイルで整数としてフォーマット設定されているかどうかに関係なく、文字列を除くすべてのフィールド値が実数としてインポートされます。

タイム・スタンプを日付として読み取ります。 デフォルトでは、すべてのタイム・スタンプ値は日付として表示されます。 このオプションを選択解除すると、この動作がオーバーライドされます。

SQL を使用してデータをプルする

カスタムの SQL を使用してデータベースからデータをインポートする場合は、データ資産インポート・ノード・プロパティーの「モード」「SQL クエリー」を選択します。 SQL SELECT ステートメントを使用して、データベースからデータの行または列をプルします。 「ソース・パス」 フィールドは、 SQL Query モードを使用している場合は適用されません。
図2: カスタムの SQL クエリー
カスタムの SQL クエリー
以下のように指定すると、指定の条件に一致するデータ行がデータベース表からプルされます。
select * from GOSALES.ORDER_DETAILS
where  UNIT_COST > 40,000 LIMIT 4
以下のように指定すると、指定の条件に一致するデータ列がデータベース表からプルされます。
select QUANTITY, UNIT_COST, UNIT_PRICE from GOSALES.ORDER_DETAILS
使用する SQL 構文は、データベース・プラットフォームによって異なる場合があります。 例えば、 Informix データベースからデータをプルする場合、 Informix では、フィールド名を二重引用符で囲む必要があります。 次に例を示します。
select "Age", "Sex" from testuser.canvas_drug

この SQL 機能は、データをプルする場合にのみ使用してください。 この SQL 機能を使用する場合は、データベース内のデータを操作しないように注意してください。

現在、このカスタム SQL 機能では、以下のデータベースを使用することができます。
  • Amazon Redshift
  • Apache Hive
  • Apache Impala
  • Compose for PostgreSQL
  • Db2 on Cloud
  • Db2 Warehouse
  • Google BigQuery
  • Informix
  • Microsoft SQL Server
  • MySQL
  • Netezza
  • Oracle
  • Pivotal Greenplum
  • Salesforce.com
  • Snowflake
  • SAP ASE
  • SAP IQ
  • Teradata
生成 AI の検索と回答
これらの回答は、製品資料の内容に基づいて、 watsonx.ai のラージ言語モデルによって生成されます。 詳細