拡張モデル・ナゲットは、拡張モデル・ノードの実行後に生成され、フロー・キャンバスに配置されます。このナゲットには、モデル作成およびモデル・スコアリングを定義する R スクリプトや Python for Spark スクリプトが含まれます。
デフォルトでは、拡張モデル・ナゲットには、モデル・スコアリングに使用されるスクリプト、データを読み取るためのオプション、および R コンソールまたは Python for Spark からのすべての出力が含まれます。 拡張モデル・ナゲットには、オプションで、グラフ、テキスト出力などの他のさまざまな形式のモデル出力も含めることができます。 拡張モデル・ナゲットが生成され、フロー・キャンバスに追加されると、出力ノードをそれに接続できます。 次に、この出力ノードがフロー内で通常の方法で使用されて、データおよびモデルに関する情報の取得、およびさまざまな形式でのデータのエクスポートが実行されます。
「シンタックス」タブ
Copy link to section
「R モデル・スコアリング・シンタックス」。 R を使用する場合は、モデル・スコアリングに使用される R スクリプトがこのフィールドに表示されます。 デフォルトでは、このフィールドは有効になっていますが、編集はできません。 Python モデル・スコアリング・スクリプトを編集するには、「編集」をクリックします。
「Python モデル・スコアリング・シンタックス (Python model scoring syntax)」。 Python for Spark を使用する場合は、モデル・スコアリングに使用される Python スクリプトがこのフィールドに表示されます。 デフォルトでは、このフィールドは有効になっていますが、編集はできません。 Python モデル・スコアリング・スクリプトを編集するには、「編集」をクリックします。
「欠損値を R の欠損値 (NA) に変換」。 選択すると、欠損値はすべて R に変換されます。NA移ります。 価値NA欠損値を識別するために R によって使用されます。 使用する R 関数の中には、データに含まれている場合の関数の動作を制御できる引数を持つものがあります。NA例えば、この関数では、以下を含むレコードを自動的に除外することを選択できます。NAこのオプションを選択しない場合、欠損値は変更されずに R に渡され、R スクリプトの実行時にエラーが発生する可能性があります。
時間帯を考慮した特殊な制御で日時フィールドを R のクラスに変換: 選択すると、日付形式または日付/時刻形式の変数が R の日付/時刻オブジェクトに変換されます。 次のいずれかのオプションを選択する必要があります。
R POSIXct. 日付形式または日時形式の変数が R に変換されるPOSIXctオブジェクト。
R POSIXlt ( リスト)。 日付形式または日時形式の変数は R に変換されます。POSIXltオブジェクト。
注:POSIX 形式は拡張オプションです。 これらのオプションは、ご使用の R スクリプトで、これらの形式を必要とする方法で日付/時刻フィールドを処理するように指定している場合にのみ使用してください。 POSIX 形式は、時刻形式の変数には適用されません。
データベースに対して拡張モデル・ナゲットを実行する場合、「フラグ型フィールドの変換」、「欠損値を R の欠損値 (NA) に変換」、および「タイム・ゾーンの特殊制御を使用して日時フィールドを R のクラスに変換」の各コントロールに対して選択したオプションは認識されません。 データベースに対してノードを実行する場合、これらのコントロールに対しては、代わりに以下のデフォルト値が使用されます。
「フラグ型フィールドの変換」は「文字列を因子に、整数および実数を倍精度に」に設定されます。
「欠損値を R の欠損値 (NA) に変換」が選択されます。
「タイム・ゾーンの特殊制御を使用して日時フィールドを R のクラスに変換」は選択されません。
「コンソール出力」タブ
Copy link to section
「コンソール出力」タブには、「シンタックス」タブの R スクリプトまたは Python for Spark スクリプトが実行されたときに受信するすべての出力が含まれます (例えば、R スクリプトを使用する場合、拡張モデル・ナゲットの「シンタックス」タブの「R モデル・スコアリング・シンタックス」フィールドにある R スクリプトが実行されたときに R コンソールから受信する出力が表示されます)。 この出力には、R スクリプトまたは Python スクリプトが実行されたときに生成される R または Python のすべてのエラー・メッセージや警告と、R コンソールからのすべてのテキスト出力が含まれます。 出力は、主にスクリプトをデバッグするために使用できます。
モデル・スコアリング・スクリプトを実行するたびに、R コンソールまたは Python for Spark から受信した出力で「コンソール出力」タブの内容が上書きされます。 コンソール出力は編集できません。