資料の 英語版 に戻る

AutoAI 用語集

最終更新: 2024年9月24日
AutoAI 用語集

機械学習モデルを作成およびデプロイするために AutoAI で使用される用語と概念について説明します。

集約スコア
4 つの異常タイプ (レベル・シフト、トレンド、ローカライズされた極値、差異) の集約。 スコアが高いほど、スコアが高いことを示します。

algorithm
分析問題を求解する最適な方法を決定するためにデータに適用される式。

AutoAI 実験
ランク付けされた一連のパイプラインをモデル候補として作成するために、一連のトレーニング定義とパラメーターを考慮する自動化されたトレーニング・プロセスです。

バッチ雇用
ストレージ・バケット内のファイル、データ接続、または接続されたデータからの入力データを処理し、選択した宛先に出力を書き込みます。

バイアス検出 (機械学習)
モデルのトレーニング・データまたは予測動作の不均衡を識別します。

二項分類
2 つのクラスを持ち、2 つのクラスのいずれかにのみサンプルを割り当てる分類モデル。

分類モデル
異なるカテゴリーのデータを予測する予測モデル。

コンフュージョン・マトリックス
モデルの肯定的な予測結果と否定的な予測結果の間の正確度を、肯定的な実際の結果と否定的な実際の結果の間で判別するパフォーマンス測定。

交差検証
機械学習モデルの有効性をテストする手法。 また、データが限られているモデルの再サンプリング手順としても使用されます。

データ代入
推定値を持つデータ・セット内の欠損値を置換します。

外因性特徴量
予測モデルに影響を与える可能性があるが、その結果に影響を与えることができない特徴量。 「サポート・フィーチャー」も参照してください。

公平性
モデルが、参照グループよりもモニター対象グループを優先するバイアスのある結果を生成するかどうかを決定します。 公平性評価は、モデルが、あるグループに対して別のグループよりも好ましいまたは望ましい結果をより頻繁に提供する傾向を示しているかどうかを検出します。 モニター対象の標準的なカテゴリーは、年齢、性別、および人種です。

フィーチャー相関
2 つのフィーチャー間の関係。 例えば、郵便番号は、一部のモデルでは収入と強い相関関係を持つ場合があります。

特徴量エンコード
カテゴリー値を数値に変換します。

特徴量の重要度
特定の列または特徴量がモデルの予測または予測に与える相対的な影響。

フィーチャーのスケーリング
データ・セット内の独立変数またはフィーチャーの範囲を正規化します。

特徴量選択
正確な予測またはスコアを最も効果的にサポートするデータの列を識別します。

特徴量変換
AutoAI において、モデル・タイプに最適な結果を得るためにトレーニング・データを変換および最適化するアルゴリズムを適用する、パイプライン作成のフェーズです。

ホールドアウト・データ
モデルのパフォーマンスをテストまたは検証するために使用されるデータ。 ホールドアウト・データは、トレーニング・データの予約部分にすることも、別のファイルにすることもできます。

ハイパーパラメーター最適化 (HPO)
最も正確なモデルを提供する設定にハイパーパラメーター値を設定するプロセス。

インクリメンタル学習
前のタスクから取得したデータを忘れずに継続的に更新されるデータを使用するモデルをトレーニングするプロセス。

大きな表データ
標準処理の制限を超えており、バッチで処理する必要がある構造化データ。 インクリメンタル学習を参照。

ラベル付きデータ
モデルのトレーニングのために取り込む適切なデータ・ベクトルを識別するためにラベル付けされるデータ。

モニター対象グループ
結果が参照グループの結果と大きく異なるかどうかを判別するためにモニターされるデータのクラス。 例えば、クレジット・アプリで、特定の年齢範囲のアプリケーションをモニターし、結果にバイアスがあるかどうかを評価するために肯定的な結果を受け取る可能性が高い年齢範囲と結果を比較することができます。

多項分類モデル
3 つ以上のクラスを持つ分類タスク。 例えば、二項分類モデルが yes または no の値を予測する場合、複数クラス・モデルは yesnoおそらく、または 適用外を予測します。

多変量の時系列
2 つ以上の変化する変数を含む時系列実験。 例えば、3 つのクライアントの電力使用量を予測する時系列モデルがあります。

最適化されたメトリック
モデルのパフォーマンスを測定するために使用されるメトリック。 例えば、正確度は、二項分類モデルのパフォーマンスを測定するために使用される標準的なメトリックです。

パイプライン (モデル候補パイプライン) (pipeline (model candidate pipeline))
ワークフロー内の steos を示すエンドツーエンド・アウトライン。

正のクラス (positive class)
目的関数に関連したクラス。

参照グループ
予測モデルで肯定的な結果を受け取る可能性が最も高いと識別するグループ。 その後、結果をモニター対象グループと比較して、結果の潜在的なバイアスを調べることができます。

回帰モデル
従属変数を 1 つ以上の独立変数に関連付けるモデル。

スコアリング
機械学習において、予測結果の信頼性を測定するプロセス。

サポート特徴量
予測ターゲットに影響を与える可能性がある入力特徴量。 参照: 外因性特徴量

テキスト分類
テキストを自動的に識別し、異なるカテゴリーに分類するモデル。

時系列モデル (AutoAI)
経時的にデータを追跡するモデル。

トレーニング済みモデル
デプロイする準備ができているモデルです。

トレーニング
ソース・データのサブセットを含む、モデル構築の初期段階です。 これ以後、結果が既に分かっている別のサブセットと対照するモデル・テストが可能。

トレーニング・データ
モデルの学習アルゴリズムを学習およびトレーニングするために使用されるデータ。

1 変量の時系列
変化する変数を 1 つのみ含む時系列実験。 例えば、温度を予測する時系列モデルには、温度の単一の予測列があります。