データ・アセット・ノードを使用して、接続を使用するリモート・データ・ソースまたはローカル・コンピューターからデータをプルできます。 最初に、接続を作成する必要があります。
Planning Analytics データベースへの接続では、(キューブではなく) ビューを選択する必要があるので注意してください。
ローカル・データ・ファイルからデータをプルすることもできます (.csv、.txt、.json、.xls、.xlsx、.sav、および.sasがサポートされています)。 スプレッドシートからデータをプルする場合は、最初のシートだけがインポートされます。 ノード・プロパティーの「データ」で、アップロードするデータ・ファイルを 1 つ以上選択することができます。 ローカル・ファイル・システムからキャンバスにデータ・ファイルをドラッグ・アンド・ドロップすることもできます。
データ・フォーマット・オプションの設定
データ構造の推測
SPSS Modeler は、データ内のレコードのサンプルを処理して、データの構造とデータのタイプを推測します。 最初の 1000 件のレコードが、保有するレコード数に適したサンプルではない場合は、 「レコード・カウントの推測」 の数を調整します。 場合によっては、 SPSS Modeler がデータの構造に関して誤った推論を行うことがあります。 詳しくは、 SPSS Modelerのトラブルシューティングを参照してください。
SPSS Statistics ファイルからデータをインポートする
SPSS Statistics ファイル (.sav) からデータをインポートする場合は、以下のオプションを使用できます。
- 名前とラベルを読み取ります。 変数名とラベルの両方を SPSS Modelerに読み込む場合に選択します。 このオプションはデフォルトで有効になっており、データ型ノードに変数名が表示されます。 ラベルは、グラフ、モデル・ブラウザー、およびその他のタイプの出力で表示されます。 デフォルトでは、出力中のラベル表示は無効になっています。
- ラベルを名前として読み取ります。 短いフィールド名ではなく、 SPSS Statistics .sav ファイルから記述変数ラベルを読み込む場合に選択します。これらのラベルを SPSS Modelerの変数名として使用します。
- データとラベルを読み取ります。 実際の値と値ラベルの両方を SPSS Modelerに読み込む場合に選択します。 このオプションはデフォルトで有効になっており、値自体がデータ型ノードに表示されます。 値ラベルは、式ビルダー、グラフ、モデル・ブラウザー、およびその他のタイプの出力に表示されます。
- ラベルをデータとして読み取ります。 値を表すために使用される数値コードまたはシンボル・コードではなく、 .sav ファイルの値ラベルを使用する場合に選択します。 例えば、
1
および2
の値が 「男性」 および 「女性」を表す性別フィールドを持つデータに対してこのオプションを選択すると、フィールドがストリングに変換され、実際の値としてmale
およびfemale
がインポートされます。このオプションを選択する前に、 SPSS Statistics データの欠損値を検討することが重要です。 例えば、数値フィールドで欠損値に対してのみラベルを使用する場合 (
0
= 「回答なし」、–99
= 「不明」)、 「ラベルをデータとして読み込む」 オプションを選択すると、値ラベル 「回答なし」 および 「不明」 のみがインポートされ、フィールドが文字列に変換されます。 このような場合は、値自体をインポートして、データ型ノードに欠損値を設定する必要があります。
フィールド・フォーマット情報を使用して、ストレージを決定します。 このオプションを選択解除すると、 .sav ファイルで整数としてフォーマット設定されているフィールド値 ( IBM SPSS Statisticsの変数ビューで Fn.0 として指定されているフィールドなど) が、整数ストレージを使用してインポートされます。 文字列を除くすべてのフィールド値は、実数としてインポートされます。
このオプションを選択すると (デフォルト)、.savファイルで整数としてフォーマット設定されているかどうかに関係なく、文字列を除くすべてのフィールド値が実数としてインポートされます。
タイム・スタンプを日付として読み取ります。 デフォルトでは、すべてのタイム・スタンプ値は日付として表示されます。 このオプションを選択解除すると、この動作がオーバーライドされます。
SQL を使用してデータをプルする
SELECT
ステートメントを使用して、データベースからデータの行または列をプルします。 「ソース・パス」 フィールドは、 SQL Query モードを使用している場合は適用されません。
select * from GOSALES.ORDER_DETAILS
where UNIT_COST > 40,000 LIMIT 4
select QUANTITY, UNIT_COST, UNIT_PRICE from GOSALES.ORDER_DETAILS
select "Age", "Sex" from testuser.canvas_drug
この SQL 機能は、データをプルする場合にのみ使用してください。 この SQL 機能を使用する場合は、データベース内のデータを操作しないように注意してください。
- Amazon Redshift
- Apache Hive
- Apache Impala
- Compose for PostgreSQL
- Db2 on Cloud
- Db2 Warehouse
- Google BigQuery
- Informix
- Microsoft SQL Server
- MySQL
- Netezza
- Oracle
- Pivotal Greenplum
- Salesforce.com
- Snowflake
- SAP ASE
- SAP IQ
- Teradata