watsonx.aiRuntime モデルで使用するために、データ資産の一連の列と関連するメタデータを保存するフィーチャ グループを作成します。 フィーチャー・グループをIBM Knowledge Catalogに公開し、フィーチャー・ストアとして使用できるようにする。 IBM Knowledge Catalogのフィーチャー・グループは、プロジェクトにアクセスしなくても、他の人が検索して再利用することができます。
要件と制約事項
以下の状況では、資産のフィーチャー・グループを表示できます。
- 必要なサービス
watsonx.aiStudio (プロジェクト用)
- 必要な権限
このページを表示するには、プロジェクトまたはカタログ内で任意の役割を持つことができます。
このページの情報を編集または更新するには、プロジェクトまたはカタログで 編集者 または 管理者 役割を持っている必要があります。
- ワークスペース
資産フィーチャー・グループは、以下のワークスペースで表示できます。
- プロジェクト
- カタログ
- 資産タイプ
以下のタイプの資産は、フィーチャー・グループを持つことができます。
- 表形式:CSV、TSV、Parquet、XLS、XSLX、AVRO、TXT、JSONファイル
- watsonx.aiStudio とIBM Knowledge Catalogの両方で構造化されサポートされる接続データ型
- データ・サイズ
無制限
フィーチャー・グループ (ベータ)
IBM Knowledge Catalogを 機能ストアとして使用し、組織で使用するデータ資産を保存して注釈を付けることができます。 watsonx.aiRuntime で使用するメタデータとともに、特定のデータ資産の列のセットを保存するフィーチャ グループを作成します。 例えば、与信承認モデルの特徴量のセットがある場合、モデルのトレーニングに使用される特徴量と、予測ターゲットとして使用される列やバイアス検出に使用される列などのメタデータを保持できます。 特徴量グループを使用すると、機械学習モデルのトレーニングに使用される特徴量のメタデータを簡単に保存できるため、他のデータ・サイエンティストも同じ特徴量を使用できます。 特定の資産をプレビューすると、フィーチャー・グループ・タブが表示されます。
- フィーチャー・グループの作成
- フィーチャー・グループの編集
- フィーチャーまたはフィーチャー・グループの削除
- カタログとのフィーチャー・グループの共有
- フィーチャー・グループでの Python API の使用
プロジェクトでのフィーチャー・グループの作成
始める前に
フィーチャー・グループを作成する前にデータ資産の プロファイル を作成する場合は、プロファイル・メタデータを選択して、フィーチャーに値を追加できます。
フィーチャー・グループの作成
データ資産の特定の列を選択して、フィーチャー・グループを形成することができます。
プロジェクトの 「資産」 タブで、関連する資産の名前をクリックしてプレビューを開き、 「フィーチャー・グループ」 タブを選択します。 ここでは、フィーチャー・グループを作成することも、既存のフィーチャー・グループを表示して編集することもできます。 1 つの資産に含めることができるフィーチャー・グループは 1 つのみです。 「新規フィーチャー・グループ」をクリックします。
フィーチャー・グループ内で使用する列を選択します。 すべての列をフィーチャーとして含めるには、 「名前」 チェック・ボックスを選択します。
IBM Knowledge Catalog でデータ資産のフィーチャー・グループを作成することもできます。 詳しくは、 カタログ資産 を参照してください。
フィーチャー・グループの編集
フィーチャーグループで使用するデータ資産の列を選択したら、各フィーチャーを表示して編集し、watsonx.aiRuntime モデルでの役割を指定します。
フィーチャー名をクリックし、 「このフィーチャーを編集」をクリックします。 ウィンドウが開き、以下のタブが表示されます。
詳細 -フィーチャーに関する以下の情報を指定します。
フィーチャーに割り当てる 役割 を選択します。
Input
: 特徴量はwatsonx.aiRuntimeモデルのトレーニングの入力として使用できる。Target
:watsonx.aiRuntime モデルを学習する際に予測対象として使用する特徴量。Identifier
: 入力データを識別するために使用される 1 次キー (顧客 ID など)。
「説明」、 「レシピ」 (機能の値を作成するために使用する任意の方法または式)、および任意の タグを入力します。
値の説明
値の説明により、特定の値の意味を明確にすることができます。 例えば、値 -1、 0 、および 1を持つ列「クレジット評価」について考えてみます。 値の説明を使用して、これらの値の意味を示すことができます。 例えば、 -1 は「評価が拒否された」ことを意味します。 特定の値の説明を入力できます。 数値の場合は、範囲を指定することもできます。 数値の範囲を指定するには、 [n, m] というテキストを入力します。ここで、 n は開始文字、 m は範囲の終了文字で、大括弧で囲み、 「追加」をクリックします。 例えば、18 から 24 までのすべての年齢値を「ミリ秒」として記述するには、値として [18,24] を入力し、説明として ミリ秒 を入力します。 プロファイル が定義されている場合は、値の説明リストにプロファイル値が表示されます。 ここから、1 つの値または複数の値を選択できます。
公平性情報
バイアスをモニターするために、値の
Monitor
グループまたはReference
グループを定義できます。 偏りのある結果のリスクが高い値は、モニター・グループに入れることができます。 これらの値は、参照グループの値と比較されます。 数値の範囲を指定するには、テキスト [n, m] を入力します。ここで、 n は範囲の始まり、 m は範囲の終わりを大括弧で囲みます。 例えば、18 から 35 までのすべての年齢値をモニターするには、 [18,35]と入力します。 次に、「モニター」または「参照」を選択し、 「追加」をクリックします。 「好ましい結果」を指定することもできます。 公平性について詳しくは、 AutoAI エクスペリメントの公平性 を参照してください。
フィーチャーを編集したら、 「保存」をクリックします。 これで、 「フィーチャーの詳細」 ウィンドウに変更が表示されます。 このウィンドウを閉じて、フィーチャー・グループに戻ります。
グループからのフィーチャーの削除
グループからフィーチャーを削除するには、以下の手順を実行します。
プロジェクト内の資産をプレビューし、 「フィーチャー・グループ」 タブを選択します。
表示される 「フィーチャー」 テーブルで、削除するフィーチャー (複数可) を選択します。
表示されるツールバーで、 「グループから削除」を選択します。
フィーチャー、またはすべてのフィーチャーを選択した場合はフィーチャー・グループが削除されます。
フィーチャー・グループの検索
すべてのカタログおよびプロジェクトで資産または列を検索できます。 フィーチャー・グループを持つアセットを検索するために検索結果をフィルタリングするには、 「データ」 を選択してフィルター・オプションを表示し、 「フィーチャー・グループ」を選択します。 これにより、フィーチャー・グループを含む資産が検索結果にリストされます。
Python API を使用した機能グループの作成と使用
また、ノートブックの assetframe-lib Python ライブラリー を使用して、フィーチャー・グループを作成および編集することもできます。 このライブラリーでは、機械学習モデルの作成時に公平性情報などの特徴量メタデータを使用することもできます。
もっと見る
ノートブックで機能グループを作成して使用する方法の例については、以下を参照してください。
- リソースハブのフィーチャーストアデータサンプルプロジェクトの作成と使用
以下も参照。
親トピック: データの準備