用語集
この用語集には、 watsonx.ai および watsonx.governanceの用語と定義が記載されています。
この用語集では、以下の相互参照が使用されています。
- 「を参照」 という表記は、非優先用語の場合は優先用語を、省略語の場合は正式な用語を参照するように促すための表記です。
- 「も参照」 は、関連する用語または対比される用語を示します。
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | R | S | T | U | V | W | Z
ACopy link to section
アクセラレーターCopy link to section
ハイパフォーマンス・コンピューティングにおいて、CPU から計算負荷の一部を取得するために使用される特殊な回路。これにより、システムの効率が向上します。 例えば、ディープ・ラーニングでは、多くの場合、GPU アクセラレーション・コンピューティングは、メイン・アプリケーションが CPU を稼働している間に、計算ワークロードの一部を GPU にオフロードするために使用されます。 「 グラフィックス処理装置 (graphics processing unit)」も参照。
責任追跡性Copy link to section
組織または個人が、それぞれの役割および適用される規制フレームワークに従って、設計、開発、運用、またはデプロイする AI システムの適切な機能をライフサイクルを通じて保証することを期待する。 これには、法的専門家がケース・バイ・ケースで責任を決定することを必要とする可能性がある AI のミスの責任者を判別することが含まれます。
アクティブ化関数Copy link to section
他のニューロンからの一連の着信活性化を与えられたニューラル・ユニットの出力を定義する関数
アクティブ・ラーニングCopy link to section
システムが必要とする場合にのみより多くのラベル付きデータを要求する、機械学習のモデル。
アクティブ・メタデータCopy link to section
機械学習プロセスによる分析に基づいて自動的に更新されるメタデータ。 例えば、プロファイル作成およびデータ品質分析では、データ資産のメタデータが自動的に更新されます。
アクティブ・ランタイム (active runtime)Copy link to section
コードを実行するアセットに計算リソースを提供するために実行される環境のインスタンス。
エージェントCopy link to section
特定の目標を達成するために、通常は強化学習を使用して、最適なアクションまたは意思決定を学習するために環境と対話するアルゴリズムまたはプログラム。
アグエンティック AICopy link to section
生成 AI フロー。プロンプトを複数のタスクに分解し、タスクを適切な生成 AI エージェントに割り当て、人間の介入なしに回答を統合することができます。
AICopy link to section
人工知能 (AI)を参照。
AI アクセラレーターCopy link to section
ディープ・ラーニング、機械学習、ニューラル・ネットワークなどの AI 関連タスクを効率的に実行して、より高速でエネルギー効率の良いコンピューティングを実現するために設計された特殊なシリコン・ハードウェア。 コア内の専用ユニット、マルチ・モジュール・チップ上の別個のチプレット、または別のカードにすることができます。
AI倫理Copy link to section
リスクと悪影響を軽減しながら AI の有益な影響を最適化する方法を研究する多領域の分野です。 AI 倫理の問題の例としては、データの責任とプライバシー、公平性、説明可能性、頑強性、透明性、環境維持性、包含性、道徳機関、価値の調整、説明責任、信頼性、テクノロジーの誤用が挙げられます。
AIガバナンスCopy link to section
組織が、組織の指示、スタッフ、プロセス、およびシステムを使用して、AI ライフサイクル全体にわたって指示、評価、モニター、および修正アクションを実行することにより、組織が意図するとおり、利害関係者が期待するとおり、および関連する規制によって要求されるとおりに、AI システムが運用されることを保証する行為。
AI の安全性Copy link to section
AI システムの信頼性、公平性、透明性、人間の価値観との整合性などの課題に対処し、人工知能システムが人間にとって有益であり、不用意に害を及ぼさないように運用されることを目的とした研究分野。
AI サービスCopy link to section
生成AIのユースケースのロジックを含み、アプリケーションからの推論のためのエンドポイントを提供する、展開可能なコードの単位。
AI システムCopy link to section
「 人工知能システム (人工知能 system)」を参照。
アルゴリズムCopy link to section
分析上の問題を解決する最適な方法を決定するためにデータに適用される式。
アナリティクスCopy link to section
データから意味のあるパターンを探し出し、それらのパターンから色々な結論を導き出すために行うデータ調査のこと。
適切な信頼Copy link to section
AI システムにおいて、その正確性、信頼性、および信頼性に合わせて調整される信頼性の量。
人工知能 (AI)Copy link to section
予測、推奨、または意思決定を行うために、モデルの形式で知識を取得、処理、作成、および適用する機能。
人工知能システム (AI システム)Copy link to section
物理環境または仮想環境に影響を与える予測、推奨、または決定を行うことができ、その出力または動作が必ずしも開発者またはユーザーによって事前に決定されているとは限らないシステム。 AI システムは通常、大量の構造化データまたは非構造化データを使用してトレーニングされます。また、人間が定義した目標を達成するために、さまざまなレベルの自律性で動作するように設計されている場合もあれば、まったく動作しないように設計されている場合もあります。
資産Copy link to section
データに関する情報、その他の重要な情報、またはデータを処理するコードを含む項目。 「 データ資産 (data asset)」も参照。
アテンション・メカニズムCopy link to section
ディープ・ラーニング・モデルのメカニズムの 1 つで、モデルが出力を生成するときに、入力のどの部分に焦点を当てるかを決定する。
AutoAI エクスペリメントCopy link to section
一連の学習定義およびパラメーターを評価することでランク付けされた一連のパイプラインをモデル候補として作成する、自動化された学習プロセス。
BCopy link to section
バッチ・デプロイメント (batch deployment)Copy link to section
ストレージ・バケット内のファイル、データ接続、または接続されたデータからの入力データを処理し、選択した宛先に出力を書き込むモデルをデプロイする方式。
バイアスCopy link to section
不公平な意思決定を行う可能性のある方法で、意図的に設計されたかどうかにかかわらず、AI システムにおける体系的なエラー。 バイアスは、AI システムと、それをトレーニングおよびテストするために使用されるデータの両方に存在する可能性があります。 AI バイアスは、文化的な期待、技術的な制限、または予期しないデプロイメント・コンテキストの結果として、AI システム内で発生する可能性があります。 「 公平性 (公平性)」も参照。
バイアス検出Copy link to section
特定の属性に基づいて、AI モデルが不公平な結果を導き出しているときにそれを検出するために、メトリックに対する公平性を計算するプロセス。
バイアス緩和Copy link to section
トレーニング・データをキュレーションし、公平性の技法を適用することで、AI モデルのバイアスを軽減します。
2 項分類Copy link to section
2 つのクラスを持つ分類モデル。 予測は、2 つのクラスのいずれかのバイナリー選択です。
CCopy link to section
分類モデルCopy link to section
異なるカテゴリーのデータを予測する予測モデル。 分類は、2 つのデータ・クラスを持つバイナリーにすることも、3 つ以上のカテゴリーがある場合は複数クラスにすることもできます。
文書の精査Copy link to section
データ・セットのすべての値が整合していること、および正しく記録されていることを確認すること。
CNNCopy link to section
認知強制機能Copy link to section
意思決定の瞬間に適用される介入により、ヒューリスティック推論を中断し、分析的思考に従事させることができます。例として、チェックリスト、診断タイムアウト、または代替手段の除外を求めることが挙げられます。
計算言語学Copy link to section
自然言語の計算モデリングのためのアプローチを検討する学際的な分野。
計算リソースCopy link to section
ツールで資産を実行するために環境テンプレートによって定義されるハードウェア・リソースおよびソフトウェア・リソース。
混同行列Copy link to section
モデルの肯定的な予測結果と否定的な予測結果の間の精度を、肯定的な実際の結果と否定的な実際の結果と比較して決定するパフォーマンス測定。
接続済みデータ・アセット (connected data asset)Copy link to section
外部データ・ソースへの接続を介してアクセスされるデータへのポインター。
接続されているフォルダー資産Copy link to section
IBM Cloud Object Storage のフォルダーを指すポインター。
接続Copy link to section
データベースへの接続に必要な情報。 必要な実際の情報は、DBMS および接続方式によって異なります。
接続アセット (connection asset)Copy link to section
データ・ソースへの接続を可能にする情報が含まれたアセット。
制約Copy link to section
- データベースにおいて、表の間の関係。
- Decision Optimizationで、問題の解によって満たされる必要がある条件。
継続的学習Copy link to section
モデルのパフォーマンスのモニター、新規データを使用した再学習、および予測品質を確保するための再デプロイで構成されるタスクの自動化。
畳み込みニューラル・ネットワーク (CNN)Copy link to section
畳み込み層を使用してイメージ・データを処理するコンピューター・ビジョン・タスクで一般的に使用されるニューラル・ネットワークのクラス。
コア ML のデプロイメント (Core ML deployment)Copy link to section
iOS アプリでの使用を目的として、デプロイメントをコア ML 形式でダウンロードするプロセス。
コーパスCopy link to section
機械学習モデルのトレーニングに使用されるソース文書の集合。
CPLEX モデルCopy link to section
CPLEX エンジンによって求解されるように定式化された Decision Optimization モデル。
CPO モデルCopy link to section
Decision Optimization CP オプティマイザー (CPO) エンジンによって求解されるように定式化された制約プログラミング・モデル。
交差検証Copy link to section
検証サンプルがない場合にモデルがどの程度一般化されるかをテストするための手法。 交差検証では、学習データがいくつかのサブセットに分割されてから、同じ数のモデルが作成され、各サブセットが順番に除外されます。 これらの各モデルはホールドアウト・サンプルでテストされ、それらのホールドアウト・サンプルのモデルの平均精度は、新しいデータに適用されたときのモデルの精度を推定するために使用されます。
キュレートCopy link to section
特定のトピックに関連するコンテンツを選択、収集、保存、および保守すること。 整理は、データを信頼できる情報およびナレッジに変換し、データの価値を高める。
DCopy link to section
データ資産Copy link to section
アップロードされたファイルなどのデータを指すアセット。 接続や接続済みデータ・アセットも、データ・アセットと見なされる。 「 資産 (asset)」も参照。
データ代入Copy link to section
データ・セット内の欠損値を、推定値または明示的な値で置換すること。
データレイクCopy link to section
フラット・アーキテクチャーで任意の形式の生データを保管する大規模なデータ・ストレージ・リポジトリー。 データレイクは、処理および分析の目的で、構造化データ、非構造化データ、およびバイナリー・データを保持します。
データレイクハウスCopy link to section
データレイクの柔軟性とデータウェアハウスの構造化された照会およびパフォーマンスの最適化を組み合わせた、統合されたデータ・ストレージおよび処理アーキテクチャー。AI および分析アプリケーションのためのスケーラブルで効率的なデータ分析を可能にします。
データ・マイニングCopy link to section
データ・ソースから重要なビジネス情報を収集し、これらの情報を相互に関連付けて、関連性、パターン、および傾向を発見するプロセス。 「 予測分析 (predictive analytics)」も参照。
Data Refinery フローCopy link to section
データをクレンジングおよびシェーピングして新しいデータ資産を生成する一連のステップ。
データサイエンスCopy link to section
洞察および知識をディスカバーするための構造化データおよび非構造化データの分析および視覚化。
データ・セットCopy link to section
データのコレクション。通常は、行 (レコード) と列 (フィールド) の形式でファイルまたはデータベース表に含まれる。
データ・ソースCopy link to section
データベースなどのデータを読み取るためのリポジトリー、キュー、またはフィード。
データ・テーブルCopy link to section
データのコレクション。通常は、行 (レコード) と列 (フィールド) の形式で表に含まれる。
データウェアハウスCopy link to section
レポート作成およびデータ分析に使用される、さまざまなソースから収集されるデータの大規模で一元化されたリポジトリー。 主に構造化データと半構造化データを保管し、企業が情報に基づいて意思決定を行えるようにします。
DDLCopy link to section
「 分散ディープ・ラーニング」を参照してください。
意思決定境界Copy link to section
スペース内のデータ・ポイントを個別のグループまたは分類に分割すること。
デコーダーのみのモデルCopy link to section
入力シーケンスから推論してワード単位で出力テキスト・ワードを生成するモデル。 デコーダー専用モデルは、テキストの生成や質問への回答などのタスクに使用されます。
ディープ・ラーニングCopy link to section
一連の計算によって入力データ (最初の層) を変換して出力 (最終層) を生成するために、階層層に編成された、相互接続されたノードの複数の層を使用する計算モデル。 ディープ・ラーニングは、人間の脳の構造と機能に触発されています。 分散ディープ・ラーニング (distributed deep learning)も参照。
ディープ・ニューラル・ネットワークCopy link to section
複数の隠れ層を持つニューラル・ネットワーク。これにより、より複雑なデータ表現が可能になります。
深推論Copy link to section
機械学習の一種で、システムがデータから洞察を生成し、常識、状況の変化、計画、意思決定など、知覚や分類を超えた認知タスクをサポートする。
展開Copy link to section
使用可能なモデルまたはアプリケーション・パッケージ。
デプロイメント・スペースCopy link to section
モデルがデプロイされ、デプロイメントが管理されるワークスペース。
決定論Copy link to section
コンピューター・システムの出力が入力によって完全に決定される場合の、そのコンピューター・システムの特性について説明する。
差別的 AICopy link to section
データ内の異なるクラスを分離する境界の検出に重点を置くアルゴリズムのクラス。
分散ディープ・ラーニング (DDL)Copy link to section
分散コンピューティングの手法を活用するディープ・ラーニング・トレーニングへのアプローチ。 DDL 環境では、コンピュート・ワークロードは中央演算処理装置とグラフィックス処理装置の間で分散されます。 ディープ・ラーニング (deep learning)も参照。
DOcplexCopy link to section
Decision Optimization の問題をモデル化して解決するための Python API。
ECopy link to section
組み込みCopy link to section
実数値のベクトルとしての、ワードやセンテンスなどの情報の単位の数値表現。 埋め込みは、高次元データの低次元表現で学習されます。 「 エンコード (encoding)」、「 表現 (representation)」も参照。
出現Copy link to section
モデルが明示的にトレーニングされていない動作を示す基盤モデルのプロパティー。
新出の行動Copy link to section
明示的に構成されていない基盤モデルによって示される動作。
エンコーダー・デコーダー・モデルCopy link to section
入力テキストを理解するためのモデル、および入力テキストに基づいて出力テキストを生成するためのモデル。 エンコーダー・デコーダー・モデルは、要約や翻訳などのタスクに使用されます。
エンコーダーのみのモデルCopy link to section
入力シーケンスを埋め込みと呼ばれる表現ベクトルに変換することにより、センテンス・レベルで入力テキストを理解するモデル。 エンコーダー専用モデルは、顧客のフィードバックの分類や大規模な文書からの情報の抽出などのタスクに使用されます。
エンコードCopy link to section
数字のセットとしての、文字またはワードなどの情報の単位の表現。 「 埋め込み (embedding)」、「 定位置エンコード (positional encoding)」も参照。
エンドポイント URL (endpoint URL)Copy link to section
サービスやオブジェクトなどのリソースを識別するネットワーク宛先アドレス。 例えば、ユーザーがデプロイメントにペイロード・データを送信するときに、モデルまたは関数のデプロイメントの場所を識別するために、エンドポイント URL が使用される。
環境Copy link to section
ジョブを実行するための計算リソース。
環境ランタイム (environment runtime)Copy link to section
アセットを実行するための環境テンプレートのインスタンス化。
環境テンプレートCopy link to section
環境ランタイムをインスタンス化するためのハードウェア・リソースおよびソフトウェア・リソースを指定する定義。
外因性機能Copy link to section
予測モデルに影響を与えることはできるが、その代わりに影響を与えることはできない機能。 例えば、温度は予測されるアイスクリームの売上に影響する可能性がありますが、アイスクリームの売上は温度に影響しません。
実験Copy link to section
最も正確なモデル構成を決定するために一連のトレーニング定義とパラメーターを考慮するモデル・トレーニング・プロセス。
説明可能性Copy link to section
- AI システムを使用するアプリケーションで行われた予測を、人間のユーザーがトレース、監査、および理解する能力。
- 人間がシステムの予測の原因を理解するために使用できる洞察を提供する AI システムの機能。
FCopy link to section
フェアネスCopy link to section
AI システムにおいて、個人または個人のグループを公平に扱うこと。 AI システムに対する特定の公平性の概念の選択は、それが使用されるコンテキストによって異なります。 「 バイアス (bias)」も参照。
フィーチャーCopy link to section
データ・セット内の項目のプロパティーまたは特性。例えば、スプレッドシート内の列など。 場合によっては、フィーチャーはデータ・セット内の他のフィーチャーの組み合わせとして設計されます。
フィーチャー・エンジニアリングCopy link to section
機械学習モデルのパフォーマンスと予測能力を向上させるために、生データから新機能を選択、変換、および作成するプロセス。
特徴量グループCopy link to section
機械学習に使用されるメタデータと共に、特定のデータ資産の列のセット。
機能の選択Copy link to section
機械学習モデルにおける正確な予測またはスコアを最も適切にサポートするデータの列を識別する。
フィーチャー・ストアCopy link to section
機能を管理および編成する中央リポジトリーまたはシステム。これにより、機械学習パイプラインおよびアプリケーション間で機能データを保管、取得、および共有するためのスケーラブルで効率的な方法が提供されます。
特徴量の変換 (feature transformation)Copy link to section
AutoAI で、モデル・タイプに最適な結果を得るために、アルゴリズムを適用して学習データを変換および最適化するパイプライン作成のフェーズ。
統合学習 (federated learning)Copy link to section
移動、結合、または共有されない複数のデータ・ソースを使用する共通機械学習モデルのトレーニング。 その結果、データのセキュリティーを損なうことなく、より適切にトレーニングされたモデルができる。
少数ショットのプロンプトCopy link to section
少数の例をモデルに提供し、タスクを完了する方法を示すプロンプト技法。
詳細なチューニングCopy link to section
追加のトレーニングを実施することにより、特定のタスクを実行するように事前にトレーニングされたモデルを適応させるプロセス。 微調整には、(1) モデルの既存パラメーターの更新 (フル・ファイン・チューニングと呼ばれる)、または (2) モデルの既存パラメーターのサブセットの更新、またはモデルへの新規パラメーターの追加とモデルの既存パラメーターのトレーニング (パラメーター効率的な微調整と呼ばれる) が含まれます。
フローCopy link to section
データの処理またはモデルのトレーニングのための一連のステップを定義するノードのコレクション。
foundation modelCopy link to section
幅広いダウンストリーム・タスクに適応させることができる AI モデル。 基盤モデルは通常、自己監視を使用してラベル付けされていないデータでトレーニングされる大規模な生成モデルです。 大規模なモデルとして、基盤モデルには数十億個のパラメーターを含めることができます。
GCopy link to section
ガント・チャートCopy link to section
タイム・スケールに沿ってスケジュール・データが横棒として表示される、プロジェクトのタイムラインおよび期間のグラフィカル表現。
Gen AICopy link to section
生成 AIを参照してください。
生成 AI (生成 AI) (gen AI)Copy link to section
テキスト、ソース・コード、画像、音声、合成データなど、さまざまなタイプのコンテンツを生成できる AI アルゴリズムのクラス。
生成的変動Copy link to section
モデルへの入力が一定に保持されている場合でも、さまざまな出力を生成する生成モデルの特性。 「 確率的 (probabilistic)」も参照。
GPUCopy link to section
グラフィカル・ビルダーCopy link to section
視覚的にコーディングしてフロー資産を作成するツール。 キャンバスは、フローを作成するために接続できるオブジェクトまたはノードを配置する領域。
グラフィックス処理装置 (GPU)Copy link to section
ディスプレイへの出力を目的としたフレーム・バッファー内のイメージの作成を加速するために、メモリーを迅速に操作および変更するように設計された特殊なプロセッサー。 GPU は、並列処理機能により、機械学習で頻繁に使用されます。 「 アクセラレーター (accelerator)」も参照。
グラウンディング Copy link to section
結果の正確性を向上させるための情報を大規模言語モデルに提供する。
HCopy link to section
ハルシネーションCopy link to section
非トピック、反復、誤り、または加工されたコンテンツを含む基盤モデルからの応答。 モデルにテキストを生成するようにプロンプトが出されたが、モデルには正しい詳細を含む結果を生成するための十分な関連テキストがない場合に、詳細を作成する必要がある幻覚が発生することがあります。
HAP 検出 (HAP 検出)Copy link to section
- ユーザーによって送信されたプロンプトと、AI モデルによって生成された応答の両方で、ヘイト、悪用、および不適切表現を検出してフィルタリングする機能。
HAP 検出機能 (HAP 検出機能)Copy link to section
- ヘイトスピーチ、罵詈雑言、冒涜など、有害な可能性のあるコンテンツをfoundation modelの出力と入力から除去する文分類器。
ホールドアウト・セットCopy link to section
トレーニング・セットと検証セットの両方から意図的に除外され、表示されていないデータに対する最終モデルのパフォーマンスのバイアスのない評価として機能する、ラベル付きデータのセット。
均質化Copy link to section
トランスフォーマーなど、少数のディープ・ニューラル・ネット・アーキテクチャーが多種多様なタスクにわたって最先端の成果を達成するという機械学習研究の動向。
HPOCopy link to section
人為的な見落としCopy link to section
AI システムによって行われた意思決定のレビューに人間が関与することで、意思決定の自律性と説明責任を実現します。
ハイパーパラメーターCopy link to section
機械学習において、モデルの精度を向上させる方法として、学習前に値が設定されるパラメーター。
ハイパーパラメーターの最適化 (hyperparameter optimization (HPO))Copy link to section
最も精度の高いモデルを生成するする設定に、ハイパーパラメーター値を設定するプロセス。
ICopy link to section
イメージCopy link to section
一連のライブラリーが含まれるソフトウェア・パッケージ。
増分学習Copy link to section
先行するタスクから取得したデータを忘れずに継続的に更新されるデータを使用して、モデルをトレーニングするプロセス。 この手法は、大規模なトレーニング・データ・ソースからのデータのバッチを使用してモデルをトレーニングするために使用されます。
推論Copy link to section
予測を行うため、またはタスクを求解するために、トレーニングされた AI モデルを介してライブ・データを実行するプロセス。
取り込むCopy link to section
- 大量のリアルタイム・データをデータベースに継続的に追加すること。
- 知識のベースを作成する目的でデータをシステムにフィードすること。
洞察Copy link to section
何かについての正確で深い理解。 コグニティブ分析を使用して洞察を引き出し、現在のスナップショットと顧客の行動や態度の予測を提供します。
インテリジェント AICopy link to section
人間の知能と同様に、意思決定、問題解決、複雑な概念の理解などの能力を実証し、知識を理解、学習、適応、および実装することができる人工知能システム。
インテントCopy link to section
質問への回答や請求書の支払いの処理など、チャットボットへのお客様の入力によって表現される目的または目標。
JCopy link to section
ジョブCopy link to section
別個に実行可能な作業単位。
KCopy link to section
知識ベースCopy link to section
「 コーパス (corpus)」を参照。
LCopy link to section
ラベルCopy link to section
教師あり学習 ( learning.Labels ) でデータ・ポイントに割り当てられたクラスまたはカテゴリー。データから派生させることができますが、多くの場合、ヒューマン・ラベラーまたはアノテーターによって適用されます。
ラベル付きデータCopy link to section
機械学習モデルのトレーニングに使用できるように、コンテキストまたは意味を追加するためのラベルが割り当てられた生データ。 例えば、モデルの入力と出力のコンテキストを提供するために、数値に郵便番号または年齢のラベルを付けることができます。
ラージ言語モデル (LLM)Copy link to section
大量のテキストを使用してトレーニングされた、多数のパラメーターを持つ言語モデル。
潜在空間Copy link to section
データ・インスタンスが埋め込まれる n 次元の数学スペース。 2 次元の潜在空間は、データを 2D 平面内の点として埋め込みます (参照: 表現空間)。 「 Representational Space」も参照。
LLMCopy link to section
MCopy link to section
機械学習 (ML) (machine learning (ML))Copy link to section
人工知能 (AI) とコンピューター・サイエンスの分野の 1 つで、データとアルゴリズムを使用して人間の学習方法を模倣し、AI モデルの精度を徐々に向上させることに重点を置いています。
機械学習フレームワーク (machine learning framework)Copy link to section
モデルの学習およびデプロイのためのライブラリーおよびランタイム。
機械学習モデル (machine learning model)Copy link to section
新しいデータを分析し、そこから学習するために使用できるアルゴリズムを開発するために、一連のデータに基づいてトレーニングされる AI モデル。
メンタルモデルCopy link to section
システムがどのように機能し、それらのアクションがシステムの結果にどのように影響するかについての個人の理解。 これらの期待がシステムの実際の能力と一致しない場合、フラストレーション、放棄、または悪用につながる可能性があります。
調整不良Copy link to section
AI システムが達成するために最適化されている目標または動作と、人間のユーザーまたは設計者の真の (多くの場合複雑な) 目標との間の矛盾
MLCopy link to section
MLOpsCopy link to section
- 機械学習モデルを開発から実動に移す方法論。
- 生産機械学習 (またはディープ・ラーニング) ライフサイクルの管理を支援する、データ・サイエンティストと運用専門家のコラボレーションのためのプラクティス。 MLOps は、自動化を強化し、生産 ML の品質を向上させると同時に、ビジネス要件や規制要件にも重点を置くことを目指しています。 これには、モデルの開発、トレーニング、検証、デプロイメント、モニター、および管理が含まれ、CI/CD などのメソッドを使用します。
モデルCopy link to section
- 機械学習のコンテキストでは、予測または意思決定を提供するために特定のデータ・セットで学習およびテストが行われた、一連の関数およびアルゴリズム。
- Decision Optimization では、さまざまなデータ・セットを使用して CPLEX 最適化エンジンで解決できる問題の数学的定式化。
ModelOpsCopy link to section
トレーニング、デプロイメント、スコアリング、評価、リトレーニング、更新など、AI モデルのライフサイクル全体を管理するための方法。
モニタリング対象グループCopy link to section
予測モデルの結果が参照グループの結果と大きく異なるかどうかを判別するためにモニターされるデータのクラス。 グループは一般に、人種、性別、年齢などの特性に基づいてモニターされます。
多クラス分類モデルCopy link to section
3 つ以上のクラスを持つ分類タスク。 例えば、二項分類モデルが「はい」または「いいえ」の値を予測する場合、複数クラス・モデルは「はい」、「いいえ」、「可能性」、または「適用外」を予測します。
マルチモーダル・モデルCopy link to section
テキスト、画像、音声などの複数のタイプのデータを処理し、それらの間で変換できる生成 AI モデル。 例えば、マルチモーダル・モデルでは、テキスト入力を取得して画像出力を生成することができます。
多変量時系列Copy link to section
2 つ以上の変化する変数を含む時系列実験。 例えば、3 つのクライアントの電力使用量を予測する時系列モデルがあるとします。
NCopy link to section
自然言語処理 (NLP) (natural language processing (NLP))Copy link to section
人間の言語に対するコンピューターの理解能力を向上させることを目的として自然言語の処理や操作に特有の問題を研究する、人工知能および言語学の 1 分野。
自然言語処理ライブラリーCopy link to section
構文分析のための基本的な自然言語処理機能、およびさまざまなテキスト処理タスクのためのすぐに使用可能な事前トレーニング済みモデルを提供するライブラリー。
ニューラル・ネットワークCopy link to section
抽象化された脳細胞をシミュレートする複雑な数式を使用してケースを予測または分類するための数学モデル。 ニューラル・ネットワークの学習は、観測された多数のケースを一度に 1 つずつ提示し、ニューラル・ネットワークがタスクを学習するまで繰り返し自己更新できるようにすることで行われる。
NLPCopy link to section
ノードCopy link to section
SPSS Modeler フローにおいては、データ操作のグラフィカル表現。
ノートブックCopy link to section
実行可能コード、そのコードの説明テキスト、および実行されるコードの結果が記載される対話式ドキュメント。
ノートブック・カーネル (notebook kernel)Copy link to section
コードを実行し、計算結果を返すノートブック・エディターの一部。
OCopy link to section
オブジェクト・ストレージCopy link to section
クラウド内で一般的に使用されるデータ保管方法の 1 つであり、ファイル階層を使用せずに、すべてのオブジェクトを同じレベルに保管する、ストレージ・プールまたはリポジトリーにデータが個別ユニットまたはオブジェクトとして保管される。
ワンショット学習Copy link to section
ディープ・ラーニングのモデル。ほとんどの人の学習は、1 つまたは 2 つの例を受信するだけで行われるという前提に基づいています。 このモデルは、教師なし学習に似ています。
ワンショット・プロンプトCopy link to section
単一の例をモデルに提供し、タスクを完了する方法を示すプロンプト技法。
オンライン・デプロイメント (online deployment)Copy link to section
リアルタイムでオンラインで予測を生成するために、Web サービスとして API エンドポイントを介してモデルまたは Python コード・デプロイメントにアクセスする方法。
オントロジーCopy link to section
関心のある領域に存在し得るオブジェクト、概念、およびその他のエンティティーと、それらの間の関係を表現するための明示的な形式の仕様。
運用アセット (operational asset)Copy link to section
ツールまたはジョブ内でコードを実行する資産。
最適化Copy link to section
課せられた制約と制限を尊重しながら、厳密に定義された問題に対する最も適切な解を見つけるプロセス。 例えば、リソースの割り振り方法を決定したり、多数の代替手段のセットから最適なエレメントまたは組み合わせを見つける方法を決定したりします。
最適化プログラミング言語Copy link to section
最適化問題のモデルの定式を、IBM CPLEX などの CPLEX 最適化エンジンによって解決できる形式で表すためのモデル作成言語。
最適化メトリックCopy link to section
モデルのパフォーマンスを測定するために使用されるメトリック。 例えば、正確度は、二項分類モデルのパフォーマンスを測定するために使用される標準的なメトリックです。
オーケストレーションCopy link to section
機械学習モデルのトレーニング、実行、デプロイ、テスト、および評価を行うことができ、自動化を使用してシステムを調整する (多くの場合、マイクロサービスを使用する) エンドツーエンド・フローを作成するプロセス。
過依存Copy link to section
AI モデルによって行われた誤った推奨をユーザーが受け入れた。 「 依存関係 (reliance)」、「 過小依存 (underreliance)」も参照。
PCopy link to section
パラメーターCopy link to section
- モデルの内部にあり、値が推定されるかデータから学習される、モデルの構成可能部分。 パラメーターは、モデルが出力を正確に予測するのに役立つように、トレーニング・プロセス中に調整されるモデルの側面です。 モデルのパフォーマンスと予測精度は、これらのパラメーターの値に大きく依存します。
- ニューラル・ネットワーク内の 2 つのニューロン間の接続の強度を示す、 0.0 から 1.0 までの実数値の重み。
データ提供者Copy link to section
統合学習において、共通モデルのトレーニングのためにデータを提供するエンティティー。 データの移動や結合は行われないが、各パーティーは統合トレーニングのメリットを享受できる。
ペイロードCopy link to section
スコア、予測、または解決策を取得するためにデプロイメントに渡されるデータ。
ペイロード・ロギングCopy link to section
ビジネス・アプリケーションにおける AI の進行中の正常性をモニターするための、ペイロード・データとデプロイメント出力のキャプチャー。
パイプラインCopy link to section
- Watson Pipelinesでは、アセットの作成から配備までのエンドツーエンドのフローを実現する。
- AutoAI,候補モデル。
パイプライン・リーダーボード (pipeline leaderboard)Copy link to section
AutoAI,では、パイプラインとして自動生成された候補モデルのリストを、指定された基準に従ってランク付けして表示する表。
ポリシーCopy link to section
現在の状態に基づいて次のアクションを決定するためにエージェントが従う戦略またはルール。
定位置エンコードCopy link to section
センテンス内の各単語の位置を含むセンテンス内の単語のエンコードなど、定位置情報を含むデータの順序付けられたシーケンスのエンコード。 「 エンコード (encoding)」も参照。
予測分析Copy link to section
将来の可能性および傾向の予測に関係するビジネス・プロセスおよび関連する一連のテクノロジー。 予測分析では、確率、統計、機械学習、人工知能などの多様な分野をビジネス上の問題に適用して、特定の状況に最適なアクションを見つけます。 「 データ・マイニング (data Mining)」も参照。
事前トレーニングされたモデルCopy link to section
特定のタスクを実行するために、以前に大規模なデータ・セットについてトレーニングされた AI モデル。 モデルを最初から作成する代わりに、事前にトレーニングされたモデルが使用されます。
事前トレーニングCopy link to section
特定のタスクのために機械学習モデルを微調整する前に、大きなデータ・セットで機械学習モデルをトレーニングするプロセス。
プライバシーCopy link to section
個人に関する情報が無許可アクセスや不適切な使用から保護されていることの保証。
確率関数Copy link to section
ランダム性の対象となる特性 (非決定性)。 確率的モデルでは、同じ入力が与えられても同じ出力は生成されません。 「 生成変動 (variability)」も参照。
プロジェクトCopy link to section
データおよびその他のアセットを処理するためのコラボレーション・ワークスペース。
プロンプトCopy link to section
- 基盤モデルの出力を準備、指示、または条件付けするデータ (テキストやイメージなど)。
- フィールドにユーザー入力し、出力画面へ遷移することを確認できるコンポーネント。
プロンプト・エンジニアリングCopy link to section
自然言語を設計するプロセスでは、特定のタスクを実行するための言語モデルのプロンプトが出されます。
プロンプトを表示するCopy link to section
基盤モデルに入力を提供して、基盤モデルが出力を生成するように誘導するプロセス。
プロンプトのチューニングCopy link to section
モデルをリトレーニングしたり重みを更新したりすることなく、事前トレーニングされたモデルを新しいタスクに適応させる効率的で低コストの方法。 プロンプトのチューニングでは、モデルの既存のパラメーターを凍結しながら、モデルのプロンプトに追加される少数の新規パラメーターを学習します。
プルーニングCopy link to section
デシジョン・ツリーまたはニューラル・ネットワークを単純化、縮小、またはトリミングするプロセス。 これは、重要度の低いノードまたは層を削除することによって行われ、複雑さを軽減してオーバーフィッティングを防止し、予測精度を維持しながらモデルの汎化を改善します。
PythonCopy link to section
データ・サイエンスと AI で使用されるプログラミング言語。
Python 関数Copy link to section
実動のモデルをサポートする Python コードを含む関数。
QCopy link to section
量子化Copy link to section
推論を高速化し、GPUメモリの必要量を削減するために、foundation modelの重みを圧縮する方法。
RCopy link to section
RCopy link to section
さまざまな分析、統計、およびグラフィカルの機能と技法を提供する、データ・サイエンスおよび AI で使用される拡張可能なスクリプト言語。
RAGCopy link to section
ランダム・シードCopy link to section
疑似乱数発生ルーチンを初期化するために使用される数値。 ランダム・シードは、乱数生成に依存するプロセスの再現性を有効にします。
参照グループCopy link to section
予測モデルで肯定的な結果を受け取る可能性が最も高いと識別されるグループ。 結果をモニター対象グループと比較して、結果に偏りがないか調べることができます。
整形Copy link to section
データのクレンジングおよびシェーピングを行うこと。
回帰モデルCopy link to section
従属変数を 1 つ以上の独立変数に関連付けるモデル。
リインフォースメント・ラーニングCopy link to section
報酬信号を最大化するために環境内で順次意思決定を行うことをエージェントが学習する機械学習技法。 試行錯誤学習に触発され、担当者は環境と対話し、フィードバックを受け取り、最適なポリシーを達成するためにアクションを調整します。
人間のフィードバックに関する強化学習 (RLHF)Copy link to section
プロンプトで指定された命令に対して言語学習モデルの応答を調整する方法。 RLHF では、ヒューマン・アノテーターがモデルからの複数の出力をランク付けする必要があります。 これらのランキングは、強化学習を使用して報酬モデルをトレーニングするために使用されます。 その後、特典モデルを使用して、ラージ言語モデルの出力を微調整します。
依拠Copy link to section
AI システムにおいて、AI モデルによって作成された推奨、または AI モデルによって生成された出力をユーザーが受け入れること。 「 過大依存 (overreliance)」、「 過小依存 (underreliance)」も参照。
表現Copy link to section
多くの場合、実数値のベクトルとしての、情報の単位のエンコード。 「 組み込み (embedding)」も参照。
表現空間Copy link to section
データ・インスタンスが埋め込まれる n 次元の数学スペース。 2 次元の潜在空間は、 2D 平面内の点としてデータを埋め込みます (「潜在空間」も参照)。 「 潜在スペース (latent space)」も参照。
再ランキングCopy link to section
指定されたクエリに答える可能性が最も高いものから最も低いものへと、一連の文書パッセージをランク付けするための生成的AIプロセス。
検索拡張世代 (RAG)Copy link to section
テキストを生成するために外部ソースからの知識で大規模言語モデルを拡張する手法。 取得ステップでは、外部ソースからの関連文書がユーザーの照会から識別されます。 生成ステップでは、これらの文書の一部が LLM プロンプトに組み込まれ、取得された文書に基づいて応答が生成されます。
報酬Copy link to section
意思決定の良しさに関するフィードバックを提供する、エージェント (通常は強化学習エージェント) を導くために使用されるシグナル。
RLHF (A)Copy link to section
人間のフィードバックに関する強化学習を参照してください。
ランタイム環境Copy link to section
ノートブックなどのツールまたはジョブを実行するために使用される、事前定義またはカスタムのハードウェアおよびソフトウェア構成。
SCopy link to section
スコアリングCopy link to section
- 機械学習では、予測される結果の信頼度を測定するプロセス。
- 入力 ID の属性が既存のエンティティーの属性とどの程度一致しているかを計算するプロセス。
スクリプトCopy link to section
実動のモデルをサポートする Python または R スクリプトを含むファイル。
自己注意Copy link to section
入力データ自体からの情報を使用して、出力の生成時に入力のどの部分にフォーカスするかを決定するアテンション・メカニズム。
自己管理学習Copy link to section
入力シーケンス内のトークンをマスキングしてからそれらを予測しようとすることにより、ラベルなしデータからモデルが学習する機械学習トレーニング方式。 例えば、「I like ________ sprouts」などです。
センチメント分析Copy link to section
テキストで表現される感情または感情の検査。例えば、映画のレビューが肯定的か否定的かを判別します。
形状Copy link to section
列のフィルタリング、ソート、削除、表の結合、および計算、データ・グループ化、階層化などの操作の実行により、データをカスタマイズすること。
スモールデータCopy link to section
人間がアクセスでき、理解できるデータ。 「 構造化データ (structured data)」も参照。
SQLプッシュバックCopy link to section
SPSS Modeler で、 SQL コードを使用してデータベースで直接さまざまなデータ準備操作やマイニング操作を実行するプロセス。
構造化データCopy link to section
レコードまたはファイル内の固定フィールドにあるデータ。 構造化データの例としては、リレーショナル・データベースやスプレッドシートなどがある。 「 非構造化データ (unstructured data)」、「 小規模データ (small data)」も参照。
構造化情報Copy link to section
構造化リソース (検索エンジン索引、データベース、知識ベースなど) に保管されている項目。
教師あり学習Copy link to section
新規データの予測を行うために、ラベル付きデータ・セットでモデルがトレーニングされる機械学習トレーニング方式。
TCopy link to section
温度Copy link to section
生成プロセスのバリエーションの量を指定する、生成モデル内のパラメーター。 温度が高くなると、モデルの出力の変動が大きくなります。
テキスト分類Copy link to section
テキストを自動的に識別し、指定されたカテゴリーに分類するモデル。
テキスト抽出Copy link to section
大規模な言語モデルの入力として使用するために、高度に構造化された情報をより単純なテキスト形式に変換する生成的AI手法。
時系列Copy link to section
定期的なポイント・イン・タイムにおける変数の値のセット。
時系列モデルCopy link to section
時間の経過とともにデータを追跡して予測するモデル。
トークンCopy link to section
テキスト内の意味または分析の離散的な単位 (ワードやサブワードなど)。
トークン化Copy link to section
テキストのストリングをワードやサブワードなどの小さい単位に分割するために自然言語処理で使用されるプロセス。
学習済みモデル (trained model)Copy link to section
実際のデータを使用してトレーニングされ、新しいデータが提示されたときに結果を予測するためにデプロイする準備ができているモデル。
トレーニングCopy link to section
ソース・データのサブセットが含まれる、モデル作成の初期段階。 モデルは、既知のデータから例を挙げて学習します。 これ以後、結果が既に分かっている別のサブセットと対照するモデル・テストが可能。
研修データCopy link to section
機械学習モデルの学習に使用されるデータの集まり。
トレーニング・セットCopy link to section
機械学習モデルを例とそれに対応するラベルに公開することによって機械学習モデルをトレーニングするために使用されるラベル付きデータのセット。これにより、モデルはパターンを学習し、予測を行うことができます。
転移学習Copy link to section
トレーニングされたモデルがまったく新しい問題に適用される機械学習戦略。
トランスフォーマーCopy link to section
定位置エンコードと自己アテンション・メカニズムを使用して、一連のトークン内の次のトークンを予測するニューラル・ネットワーク・アーキテクチャー。
透明性Copy link to section
AI システムがどのように設計および開発されたかについて、利害関係者と適切な情報を共有する。 この情報の例としては、どのようなデータが収集され、どのように使用および保管され、誰がアクセスできるか、正確度、頑強性、およびバイアスについてのテスト結果などがあります。
トラスト・キャリブレーションCopy link to section
AI システムの正確性、信頼性、信頼性などの要因に基づいて、AI システムに対する信頼性を評価および調整するプロセス。
チューリング・テストCopy link to section
アラン・チューリング (Alan Turing) が 1950 年に提唱した、人間と同等または区別できない知的行動を示す機械の能力のテスト。
UCopy link to section
過少依存Copy link to section
AI モデルによって行われた正しい推奨をユーザーが拒否した。 「 依存関係 (overreliance)」、「 依存関係 (reliance)」も参照。
単変量時系列Copy link to section
1 つの変化する変数のみを含む時系列実験。 例えば、温度を予測する時系列モデルには、温度の単一の予測列があります。
非構造化データCopy link to section
固定のフィールドにではなく、構造化されていない形式で保管されるデータ。 ワード・プロセッシング文書のデータは、非構造化データの一例である。 「 構造化データ (structured data)」も参照。
非構造化情報Copy link to section
自然言語テキスト文書など、固定された場所に含まれていないデータ。
教師なし学習Copy link to section
- ラベルなしの生データを使用して、人的労力をほとんどまたはまったくかけずにシステムを学習することが可能な、ディープ・ラーニング用のモデル。
- モデルにラベル付きデータが提供されず、データ内のパターンまたは構造を単独で検出する必要がある機械学習トレーニング方式。
VCopy link to section
検証セットCopy link to section
トレーニング・プロセス中に機械学習モデルのパフォーマンスと汎化能力を評価するために使用されるラベル付きデータの別個のセットで、ハイパーパラメーター・チューニングおよびモデル選択を支援します。
ベクトルCopy link to section
[1, 2, 5] または [0.7, 0.2, -1.0] などの、1 次元の数値の番号付きリスト。
ベクトル・データベースCopy link to section
ベクトル指標Copy link to section
ベクトル・ストアからの文書のベクトル化された埋め込みを取得する索引。
ベクトル・ストアCopy link to section
文書のベクトル化された組み込みを保管するリポジトリー。
言語化Copy link to section
生成 AI において、チューニングおよび推論の際にデータをフォーマットするためのテンプレート。
仮想エージェントCopy link to section
自然言語を処理して単純なビジネス・トランザクションに対応したり、より複雑な要求を対象分野の専門知識を持つ人に送付したりすることができる、事前にトレーニングされたチャットボット。
可視化Copy link to section
グラフ、図表、プロット、表、マップ、またはその他のデータ・ビジュアル表示。
WCopy link to section
ウェイトCopy link to section
ネットワークの層の中で入力データを変換するノードの係数。 重みは、AI モデルがトレーニングを通じて学習するパラメーターであり、モデルの予測の誤差を減らすために値を調整します。
ZCopy link to section
ゼロ・ショット・プロンプトCopy link to section
モデルが具体的な方法の例を示さずにタスクを完了するプロンプト手法。