Extension Importノードを使用すると、R、Python、またはPythonfor Sparkで書かれたスクリプトを実行してデータをインポートできます。
ノードをキャンバスに追加したら、ノードをダブルクリックしてプロパティーを開きます。
「シンタックス」タブ
構文の種類(R、Python、Pythonfor Spark)を選択します。 次に、データをインポートするためのカスタム・スクリプトを入力するか、貼り付けます。 シンタックスの準備ができたら、ノードを実行できます。
「コンソール出力」タブ
コンソール出力タブには、RスクリプトまたはPythonスクリプトの実行時に受信した出力が表示されます(たとえば、Rスクリプトを使用している場合、「構文」タブの「R構文」フィールドのRスクリプトが実行されたときにRコンソールから受信した出力が表示されます)。 この出力には、R スクリプトまたは Python スクリプトの実行時に生成される R または Python のエラー・メッセージや警告が含まれる場合があります。 出力は、主にスクリプトをデバッグするために使用できます。 コンソール出力タブには、R 構文フィールドまたは Python 構文 フィールドからのスクリプトも含まれています。
Extension Importスクリプトが実行されるたびに、Console Outputタブの内容はRまたはPythonコンソールから受け取った出力で上書きされます。 出力を編集することはできません。
フィールドのフィルタリングまたは名前の変更
フロー内の任意の場所でフィールドの名前変更またはフィールドを除外することができます。 例えば、患者 (レコード・レベル・データ) のカリウム値 (フィールド・レベル・データ) を重要視していない場合、「K
」(カリウム値) フィールドを除外できます。
- フィルター・ノードを使用して、フロー内の任意の場所でフィールドの名前を変更したり、フィルタリングすることができます。
- フィルター・ノードを使用して、特定のインポート・ノードから別のインポート・ノードにフィールドをマップできます。
データ型の情報の表示と設定
データ型ノードで、モデル作成などの処理に必要不可欠なフィールドのメタデータとプロパティーを指定することができます。- データ中の各フィールドに対して範囲、セット型、順序セット型またはフラグ型などの使用タイプを指定する
- 欠損値やシステム ヌルの処理に関するオプションを設定する
- モデリングのためのフィールドの役割を設定する
- データから自動的に値を読み取るためのフィールドとオプションの値を指定する
- 値ラベルを指定する