カーネル密度推定 (KDE)© は、Ball Tree または KD Tree のアルゴリズムを使用してクエリを効率化し、教師なし学習、特徴量エンジニアリング、データのモデル化の概念を結合します。
KDE などの近隣ベースの手法が、最もよく使用され、有用な密度推定手法です。 KDE は任意の数の次元で実行できますが、実際のところは、高次元ではパフォーマンスが低下する可能性があります。 watsonx.ai Studio」の「KDE Modeling」ノードと「KDE Simulation」ノードは、KDEライブラリのコア機能とよく使われるパラメータを公開しています。 これらのノードは Python で実装されています。 1
KDE ノードを使用するには、上流のデータ型ノードをセットアップする必要があります。 KDE ノードは、データ型ノードから (または、上流のインポート・ノードのデータ型から) 入力値を読み込みます。
KDE モデル作成ノードは、モデル作成ノード・パレットで使用することができます。 KDE モデル作成ノードはモデル ナゲットを生成します。ナゲットのスコア値は、入力データからのカーネル密度の値になります。
KDE シミュレーション・ノードは、出力ノード・パレットで使用することができます。 「KDE シミュレーション」ノードは、入力データと同じ分布を持つレコードを作成できる KDE 生成入力ノードを生成します。 KDE 生成ノードのプロパティーで、このノードが作成するレコードの数 (デフォルト値は 1) を指定して、ランダム・シードを生成することができます。
例を含む KDE について詳しくは、 KDE の資料を参照してください。 1
1 「ユーザー・ガイド」。 「カーネル密度推定 (Kernel Density Estimation)」。 Web. © 2007-2018, scikit-learn developers.