0 / 0
資料の 英語版 に戻る
ノードのキャッシュ・オプション
最終更新: 2024年6月07日
ノードのキャッシュ・オプション (SPSS Modeler)

任意の非ターミナル・ノード上にキャッシュを設定すると、フローの実行を最適化することができます。 ノードにキャッシュを設定すると、次のデータ・フローの実行時にそのノードを通過するデータがキャッシュされます。 それ以降は、データ・ソースではなくキャッシュ (一時的に保存されたキャッシュ) からデータが読み込まれます。

キャッシュは、ソート、結合、集計など、時間のかかる操作に最も有用です。 例えば、特定のデータベースと、場所別に販売データが要約されたレコード集計ノードから販売データを読み込むようにインポート・ノードが設定されていると仮定します。 この場合、データ・セット全体ではなく集計後のデータだけをキャッシュに保管すればよいため、インポート・ノードではなくレコード集計ノード上にキャッシュを設定することになります。
注: インポート・ノードでキャッシュすると、 SPSS Modelerに読み込まれた元のデータのコピーを単に保管するだけでは、ほとんどの環境でパフォーマンスは向上しません。

キャッシュが有効になっているノードは、特殊な円記号アイコンで表示されます。 ノード上でデータがキャッシュされると、このアイコンがチェック・マークに変わります。

図1: キャッシュが空になっているノードとキャッシュがいっぱいになっているノード
キャッシュが空のノードとキャッシュが満杯のノードを表示します

キャッシュを有効にする

フロー内のノードの上にカーソルを移動し、オーバーフロー・メニュー をクリックして、 キャッシュ > 「使用可能」を選択します。

キャッシュを使用不可にすることで、いつでもキャッシュをオフにすることができます。

データベース内にノード上のデータをキャッシュする

データベース内で稼働するフローの場合、ファイル・システムではなくデータベース内の一時テーブルに、フロー内のデータをキャッシュすることができます。 この機能を SQL 最適化と組み合わせると、パフォーマンスが著しく向上する可能性があります。 例えば、データ・マイニング・ビューを作成するために複数のテーブルを併合するフローからの出力をキャッシュし、必要に応じて再使用できます。 すべての下流ノードで自動的に SQL を生成するようにすると、パフォーマンスがさらに向上する可能性があります。

データベースのキャッシングを利用するには、SQL 最適化とデータベース・キャッシングの両方を有効にする必要があります。

データベース・キャッシングを有効にすると、任意の非端末ノードでデータをキャッシュに入れることができ、次回フローが実行されるときにデータベース内にキャッシュが自動的に直接作成されます。 データベース・キャッシングまたは SQL 最適化が有効にされていないと、キャッシュは、代わりにファイル・システムへ書き出されます。

注: データベース Db2、 Oracle、 SQL Server、および Teradataは、キャッシングの目的で一時表をサポートしています。 Netezza などのその他のデータベースでは、データベース・キャッシングに通常のテーブルが使用されます。

キャッシュ内のデータを取り消す

ノードごとの円記号アイコンは、キャッシュが空であることを示します。 キャッシュがいっぱいになると、アイコンがチェック・マークになります。 キャッシュの内容を置き換える場合は、最初にキャッシュを取り消してからデータ・フローを再実行して、キャッシュにデータを格納しなおす必要があります。

フロー内のノードの上にカーソルを移動し、オーバーフロー・メニュー をクリックして、 キャッシュ > 「フラッシュ」を選択します。

生成 AI の検索と回答
これらの回答は、製品資料の内容に基づいて、 watsonx.ai のラージ言語モデルによって生成されます。 詳細