この用語集には、 watsonx.ai および watsonx.governanceの用語と定義が記載されています。
この用語集では、以下の相互参照が使用されています。
- 「を参照」 という表記は、非優先用語の場合は優先用語を、省略語の場合は正式な用語を参照するように促すための表記です。
- 「も参照」 は、関連する用語または対比される用語を示します。
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | R | S | T | U | V | W | Z
A
アクセラレーター
ハイパフォーマンス・コンピューティングにおいて、CPU から計算負荷の一部を取得するために使用される特殊な回路。これにより、システムの効率が向上します。 例えば、ディープ・ラーニングでは、多くの場合、GPU アクセラレーション・コンピューティングは、メイン・アプリケーションが CPU を稼働している間に、計算ワークロードの一部を GPU にオフロードするために使用されます。 「 グラフィックス処理装置 (graphics processing unit)」も参照。
責任追跡性
組織または個人が、それぞれの役割および適用される規制フレームワークに従って、設計、開発、運用、またはデプロイする AI システムの適切な機能をライフサイクルを通じて保証することを期待する。 これには、法的専門家がケース・バイ・ケースで責任を決定することを必要とする可能性がある AI のミスの責任者を判別することが含まれます。
アクティブ化関数
他のニューロンからの一連の着信活性化を与えられたニューラル・ユニットの出力を定義する関数
アクティブ・ラーニング
システムが必要とする場合にのみより多くのラベル付きデータを要求する、機械学習のモデル。
アクティブ・メタデータ
機械学習プロセスによる分析に基づいて自動的に更新されるメタデータ。 例えば、プロファイル作成およびデータ品質分析では、データ資産のメタデータが自動的に更新されます。
アクティブ・ランタイム (active runtime)
コードを実行するアセットに計算リソースを提供するために実行される環境のインスタンス。
エージェント
特定の目標を達成するために、通常は強化学習を使用して、最適なアクションまたは意思決定を学習するために環境と対話するアルゴリズムまたはプログラム。
アグエンティック AI
生成 AI フロー。プロンプトを複数のタスクに分解し、タスクを適切な生成 AI エージェントに割り当て、人間の介入なしに回答を統合することができます。
AI
人工知能 (AI)を参照。
AI アクセラレーター
ディープ・ラーニング、機械学習、ニューラル・ネットワークなどの AI 関連タスクを効率的に実行して、より高速でエネルギー効率の良いコンピューティングを実現するために設計された特殊なシリコン・ハードウェア。 コア内の専用ユニット、マルチ・モジュール・チップ上の別個のチプレット、または別のカードにすることができます。
AI倫理
リスクと悪影響を軽減しながら AI の有益な影響を最適化する方法を研究する多領域の分野です。 AI 倫理の問題の例としては、データの責任とプライバシー、公平性、説明可能性、頑強性、透明性、環境維持性、包含性、道徳機関、価値の調整、説明責任、信頼性、テクノロジーの誤用が挙げられます。
AIガバナンス
組織が、組織の指示、スタッフ、プロセス、およびシステムを使用して、AI ライフサイクル全体にわたって指示、評価、モニター、および修正アクションを実行することにより、組織が意図するとおり、利害関係者が期待するとおり、および関連する規制によって要求されるとおりに、AI システムが運用されることを保証する行為。
AI の安全性
AI システムの信頼性、公平性、透明性、人間の価値観との整合性などの課題に対処し、人工知能システムが人間にとって有益であり、不用意に害を及ぼさないように運用されることを目的とした研究分野。
AI サービス
生成AIのユースケースのロジックを含み、アプリケーションからの推論のためのエンドポイントを提供する、展開可能なコードの単位。
AI システム
「 人工知能システム (人工知能 system)」を参照。
アルゴリズム
分析上の問題を解決する最適な方法を決定するためにデータに適用される式。
アナリティクス
データから意味のあるパターンを探し出し、それらのパターンから色々な結論を導き出すために行うデータ調査のこと。
適切な信頼
AI システムにおいて、その正確性、信頼性、および信頼性に合わせて調整される信頼性の量。
人工知能 (AI)
予測、推奨、または意思決定を行うために、モデルの形式で知識を取得、処理、作成、および適用する機能。
人工知能システム (AI システム)
物理環境または仮想環境に影響を与える予測、推奨、または決定を行うことができ、その出力または動作が必ずしも開発者またはユーザーによって事前に決定されているとは限らないシステム。 AI システムは通常、大量の構造化データまたは非構造化データを使用してトレーニングされます。また、人間が定義した目標を達成するために、さまざまなレベルの自律性で動作するように設計されている場合もあれば、まったく動作しないように設計されている場合もあります。
資産
データに関する情報、その他の重要な情報、またはデータを処理するコードを含む項目。 「 データ資産 (data asset)」も参照。
アテンション・メカニズム
ディープ・ラーニング・モデルのメカニズムの 1 つで、モデルが出力を生成するときに、入力のどの部分に焦点を当てるかを決定する。
AutoAI エクスペリメント
一連の学習定義およびパラメーターを評価することでランク付けされた一連のパイプラインをモデル候補として作成する、自動化された学習プロセス。
B
バッチ・デプロイメント (batch deployment)
ストレージ・バケット内のファイル、データ接続、または接続されたデータからの入力データを処理し、選択した宛先に出力を書き込むモデルをデプロイする方式。
バイアス
不公平な意思決定を行う可能性のある方法で、意図的に設計されたかどうかにかかわらず、AI システムにおける体系的なエラー。 バイアスは、AI システムと、それをトレーニングおよびテストするために使用されるデータの両方に存在する可能性があります。 AI バイアスは、文化的な期待、技術的な制限、または予期しないデプロイメント・コンテキストの結果として、AI システム内で発生する可能性があります。 「 公平性 (公平性)」も参照。
バイアス検出
特定の属性に基づいて、AI モデルが不公平な結果を導き出しているときにそれを検出するために、メトリックに対する公平性を計算するプロセス。
バイアス緩和
トレーニング・データをキュレーションし、公平性の技法を適用することで、AI モデルのバイアスを軽減します。
2 項分類
2 つのクラスを持つ分類モデル。 予測は、2 つのクラスのいずれかのバイナリー選択です。
C
分類モデル
異なるカテゴリーのデータを予測する予測モデル。 分類は、2 つのデータ・クラスを持つバイナリーにすることも、3 つ以上のカテゴリーがある場合は複数クラスにすることもできます。
浄化
データ・セットのすべての値が整合していること、および正しく記録されていることを確認すること。
CNN
認知強制機能
意思決定の瞬間に適用される介入により、ヒューリスティック推論を中断し、分析的思考に従事させることができます。例として、チェックリスト、診断タイムアウト、または代替手段の除外を求めることが挙げられます。
計算言語学
自然言語の計算モデリングのためのアプローチを検討する学際的な分野。
計算リソース
ツールで資産を実行するために環境テンプレートによって定義されるハードウェア・リソースおよびソフトウェア・リソース。
混同行列
モデルの肯定的な予測結果と否定的な予測結果の間の精度を、肯定的な実際の結果と否定的な実際の結果と比較して決定するパフォーマンス測定。
接続済みデータ・アセット (connected data asset)
外部データ・ソースへの接続を介してアクセスされるデータへのポインター。
接続されているフォルダー資産
IBM Cloud Object Storage のフォルダーを指すポインター。
接続
データベースへの接続に必要な情報。 必要な実際の情報は、DBMS および接続方式によって異なります。
接続アセット (connection asset)
データ・ソースへの接続を可能にする情報が含まれたアセット。
制約
- データベースにおいて、表の間の関係。
- Decision Optimizationで、問題の解によって満たされる必要がある条件。
継続的学習
モデルのパフォーマンスのモニター、新規データを使用した再学習、および予測品質を確保するための再デプロイで構成されるタスクの自動化。
畳み込みニューラル・ネットワーク (CNN)
畳み込み層を使用してイメージ・データを処理するコンピューター・ビジョン・タスクで一般的に使用されるニューラル・ネットワークのクラス。
コア ML のデプロイメント (Core ML deployment)
iOS アプリでの使用を目的として、デプロイメントをコア ML 形式でダウンロードするプロセス。
コーパス
機械学習モデルのトレーニングに使用されるソース文書の集合。
CPLEX モデル
CPLEX エンジンによって求解されるように定式化された Decision Optimization モデル。
CPO モデル
Decision Optimization CP オプティマイザー (CPO) エンジンによって求解されるように定式化された制約プログラミング・モデル。
交差検証
検証サンプルがない場合にモデルがどの程度一般化されるかをテストするための手法。 交差検証では、学習データがいくつかのサブセットに分割されてから、同じ数のモデルが作成され、各サブセットが順番に除外されます。 これらの各モデルはホールドアウト・サンプルでテストされ、それらのホールドアウト・サンプルのモデルの平均精度は、新しいデータに適用されたときのモデルの精度を推定するために使用されます。
キュレート
特定のトピックに関連するコンテンツを選択、収集、保存、および保守すること。 整理は、データを信頼できる情報およびナレッジに変換し、データの価値を高める。
D
データ資産
アップロードされたファイルなどのデータを指すアセット。 接続や接続済みデータ・アセットも、データ・アセットと見なされる。 「 資産 (asset)」も参照。
データ代入
データ・セット内の欠損値を、推定値または明示的な値で置換すること。
データレイク
フラット・アーキテクチャーで任意の形式の生データを保管する大規模なデータ・ストレージ・リポジトリー。 データレイクは、処理および分析の目的で、構造化データ、非構造化データ、およびバイナリー・データを保持します。
データレイクハウス
データレイクの柔軟性とデータウェアハウスの構造化された照会およびパフォーマンスの最適化を組み合わせた、統合されたデータ・ストレージおよび処理アーキテクチャー。AI および分析アプリケーションのためのスケーラブルで効率的なデータ分析を可能にします。
データ・マイニング
データ・ソースから重要なビジネス情報を収集し、これらの情報を相互に関連付けて、関連性、パターン、および傾向を発見するプロセス。 「 予測分析 (predictive analytics)」も参照。
Data Refinery フロー
データをクレンジングおよびシェーピングして新しいデータ資産を生成する一連のステップ。
データサイエンス
洞察および知識をディスカバーするための構造化データおよび非構造化データの分析および視覚化。
データ・セット
データのコレクション。通常は、行 (レコード) と列 (フィールド) の形式でファイルまたはデータベース表に含まれる。
データ・ソース
データベースなどのデータを読み取るためのリポジトリー、キュー、またはフィード。
データ・テーブル
データのコレクション。通常は、行 (レコード) と列 (フィールド) の形式で表に含まれる。
データウェアハウス
レポート作成およびデータ分析に使用される、さまざまなソースから収集されるデータの大規模で一元化されたリポジトリー。 主に構造化データと半構造化データを保管し、企業が情報に基づいて意思決定を行えるようにします。
DDL
「 分散ディープ・ラーニング」を参照してください。
意思決定境界
スペース内のデータ・ポイントを個別のグループまたは分類に分割すること。
デコーダーのみのモデル
入力シーケンスから推論してワード単位で出力テキスト・ワードを生成するモデル。 デコーダー専用モデルは、テキストの生成や質問への回答などのタスクに使用されます。
ディープ・ラーニング
一連の計算によって入力データ (最初の層) を変換して出力 (最終層) を生成するために、階層層に編成された、相互接続されたノードの複数の層を使用する計算モデル。 ディープ・ラーニングは、人間の脳の構造と機能に触発されています。 分散ディープ・ラーニング (distributed deep learning)も参照。
ディープ・ニューラル・ネットワーク
複数の隠れ層を持つニューラル・ネットワーク。これにより、より複雑なデータ表現が可能になります。
深推論
機械学習の一種で、システムがデータから洞察を生成し、常識、状況の変化、計画、意思決定など、知覚や分類を超えた認知タスクをサポートする。
展開
使用可能なモデルまたはアプリケーション・パッケージ。
デプロイメント・スペース
モデルがデプロイされ、デプロイメントが管理されるワークスペース。
決定論
コンピューター・システムの出力が入力によって完全に決定される場合の、そのコンピューター・システムの特性について説明する。
差別的 AI
データ内の異なるクラスを分離する境界の検出に重点を置くアルゴリズムのクラス。
分散ディープ・ラーニング (DDL)
分散コンピューティングの手法を活用するディープ・ラーニング・トレーニングへのアプローチ。 DDL 環境では、コンピュート・ワークロードは中央演算処理装置とグラフィックス処理装置の間で分散されます。 ディープ・ラーニング (deep learning)も参照。
DOcplex
Decision Optimization の問題をモデル化して解決するための Python API。
E
組み込み
実数値のベクトルとしての、ワードやセンテンスなどの情報の単位の数値表現。 埋め込みは、高次元データの低次元表現で学習されます。 「 エンコード (encoding)」、「 表現 (representation)」も参照。
出現
モデルが明示的にトレーニングされていない動作を示す基盤モデルのプロパティー。
新出の行動
明示的に構成されていない基盤モデルによって示される動作。
エンコーダー・デコーダー・モデル
入力テキストを理解するためのモデル、および入力テキストに基づいて出力テキストを生成するためのモデル。 エンコーダー・デコーダー・モデルは、要約や翻訳などのタスクに使用されます。
エンコーダーのみのモデル
入力シーケンスを埋め込みと呼ばれる表現ベクトルに変換することにより、センテンス・レベルで入力テキストを理解するモデル。 エンコーダー専用モデルは、顧客のフィードバックの分類や大規模な文書からの情報の抽出などのタスクに使用されます。
エンコード
数字のセットとしての、文字またはワードなどの情報の単位の表現。 「 埋め込み (embedding)」、「 定位置エンコード (positional encoding)」も参照。
エンドポイント URL (endpoint URL)
サービスやオブジェクトなどのリソースを識別するネットワーク宛先アドレス。 例えば、ユーザーがデプロイメントにペイロード・データを送信するときに、モデルまたは関数のデプロイメントの場所を識別するために、エンドポイント URL が使用される。
環境
ジョブを実行するための計算リソース。
環境ランタイム (environment runtime)
アセットを実行するための環境テンプレートのインスタンス化。
環境テンプレート
環境ランタイムをインスタンス化するためのハードウェア・リソースおよびソフトウェア・リソースを指定する定義。
外因性機能
予測モデルに影響を与えることはできるが、その代わりに影響を与えることはできない機能。 例えば、温度は予測されるアイスクリームの売上に影響する可能性がありますが、アイスクリームの売上は温度に影響しません。
実験
最も正確なモデル構成を決定するために一連のトレーニング定義とパラメーターを考慮するモデル・トレーニング・プロセス。
説明可能性
- AI システムを使用するアプリケーションで行われた予測を、人間のユーザーがトレース、監査、および理解する能力。
- 人間がシステムの予測の原因を理解するために使用できる洞察を提供する AI システムの機能。
F
フェアネス
AI システムにおいて、個人または個人のグループを公平に扱うこと。 AI システムに対する特定の公平性の概念の選択は、それが使用されるコンテキストによって異なります。 「 バイアス (bias)」も参照。
フィーチャー
データ・セット内の項目のプロパティーまたは特性。例えば、スプレッドシート内の列など。 場合によっては、フィーチャーはデータ・セット内の他のフィーチャーの組み合わせとして設計されます。
フィーチャー・エンジニアリング
機械学習モデルのパフォーマンスと予測能力を向上させるために、生データから新機能を選択、変換、および作成するプロセス。
特徴量グループ
機械学習に使用されるメタデータと共に、特定のデータ資産の列のセット。
機能の選択
機械学習モデルにおける正確な予測またはスコアを最も適切にサポートするデータの列を識別する。
フィーチャー・ストア
機能を管理および編成する中央リポジトリーまたはシステム。これにより、機械学習パイプラインおよびアプリケーション間で機能データを保管、取得、および共有するためのスケーラブルで効率的な方法が提供されます。
特徴量の変換 (feature transformation)
AutoAI で、モデル・タイプに最適な結果を得るために、アルゴリズムを適用して学習データを変換および最適化するパイプライン作成のフェーズ。
統合学習 (federated learning)
移動、結合、または共有されない複数のデータ・ソースを使用する共通機械学習モデルのトレーニング。 その結果、データのセキュリティーを損なうことなく、より適切にトレーニングされたモデルができる。
少数ショットのプロンプト
少数の例をモデルに提供し、タスクを完了する方法を示すプロンプト技法。
詳細なチューニング
追加のトレーニングを実施することにより、特定のタスクを実行するように事前にトレーニングされたモデルを適応させるプロセス。 微調整には、(1) モデルの既存パラメーターの更新 (フル・ファイン・チューニングと呼ばれる)、または (2) モデルの既存パラメーターのサブセットの更新、またはモデルへの新規パラメーターの追加とモデルの既存パラメーターのトレーニング (パラメーター効率的な微調整と呼ばれる) が含まれます。
フロー
データの処理またはモデルのトレーニングのための一連のステップを定義するノードのコレクション。
foundation model
幅広いダウンストリーム・タスクに適応させることができる AI モデル。 基盤モデルは通常、自己監視を使用してラベル付けされていないデータでトレーニングされる大規模な生成モデルです。 大規模なモデルとして、基盤モデルには数十億個のパラメーターを含めることができます。
G
ガント・チャート
タイム・スケールに沿ってスケジュール・データが横棒として表示される、プロジェクトのタイムラインおよび期間のグラフィカル表現。
Gen AI
生成 AIを参照してください。
生成 AI (生成 AI) (gen AI)
テキスト、ソース・コード、画像、音声、合成データなど、さまざまなタイプのコンテンツを生成できる AI アルゴリズムのクラス。
生成的変動
モデルへの入力が一定に保持されている場合でも、さまざまな出力を生成する生成モデルの特性。 「 確率的 (probabilistic)」も参照。
GPU
グラフィカル・ビルダー
視覚的にコーディングしてフロー資産を作成するツール。 キャンバスは、フローを作成するために接続できるオブジェクトまたはノードを配置する領域。
グラフィックス処理装置 (GPU)
ディスプレイへの出力を目的としたフレーム・バッファー内のイメージの作成を加速するために、メモリーを迅速に操作および変更するように設計された特殊なプロセッサー。 GPU は、並列処理機能により、機械学習で頻繁に使用されます。 「 アクセラレーター (accelerator)」も参照。
接地
結果の正確性を向上させるための情報を大規模言語モデルに提供する。
H
幻覚
非トピック、反復、誤り、または加工されたコンテンツを含む基盤モデルからの応答。 モデルにテキストを生成するようにプロンプトが出されたが、モデルには正しい詳細を含む結果を生成するための十分な関連テキストがない場合に、詳細を作成する必要がある幻覚が発生することがあります。
HAP 検出 (HAP 検出)
- ユーザーによって送信されたプロンプトと、AI モデルによって生成された応答の両方で、ヘイト、悪用、および不適切表現を検出してフィルタリングする機能。
HAP 検出機能 (HAP 検出機能)
- ヘイトスピーチ、罵詈雑言、冒涜など、有害な可能性のあるコンテンツをfoundation modelの出力と入力から除去する文分類器。
ホールドアウト・セット
トレーニング・セットと検証セットの両方から意図的に除外され、表示されていないデータに対する最終モデルのパフォーマンスのバイアスのない評価として機能する、ラベル付きデータのセット。
均質化
変圧器など、少数のディープ・ニューラル・ネット・アーキテクチャーが多種多様なタスクにわたって最先端の成果を達成するという機械学習研究の動向。
HPO
人間の監督
AI システムによって行われた意思決定のレビューに人間が関与することで、意思決定の自律性と説明責任を実現します。
ハイパーパラメーター
機械学習において、モデルの精度を向上させる方法として、学習前に値が設定されるパラメーター。
ハイパーパラメーターの最適化 (hyperparameter optimization (HPO))
最も精度の高いモデルを生成するする設定に、ハイパーパラメーター値を設定するプロセス。
I
イメージ
一連のライブラリーが含まれるソフトウェア・パッケージ。
増分学習
先行するタスクから取得したデータを忘れずに継続的に更新されるデータを使用して、モデルをトレーニングするプロセス。 この手法は、大規模なトレーニング・データ・ソースからのデータのバッチを使用してモデルをトレーニングするために使用されます。
推論
予測を行うため、またはタスクを求解するために、トレーニングされた AI モデルを介してライブ・データを実行するプロセス。
取り込む
- 大量のリアルタイム・データをデータベースに継続的に追加すること。
- 知識のベースを作成する目的でデータをシステムにフィードすること。
洞察
何かについての正確で深い理解。 コグニティブ分析を使用して洞察を引き出し、現在のスナップショットと顧客の行動や態度の予測を提供します。
インテリジェント AI
人間の知能と同様に、意思決定、問題解決、複雑な概念の理解などの能力を実証し、知識を理解、学習、適応、および実装することができる人工知能システム。
インテント
質問への回答や請求書の支払いの処理など、チャットボットへのお客様の入力によって表現される目的または目標。
J
ジョブ
別個に実行可能な作業単位。
K
知識ベース
「 コーパス (corpus)」を参照。
L
ラベル
教師あり学習 ( learning.Labels ) でデータ・ポイントに割り当てられたクラスまたはカテゴリー。データから派生させることができますが、多くの場合、ヒューマン・ラベラーまたはアノテーターによって適用されます。
ラベル付きデータ
機械学習モデルのトレーニングに使用できるように、コンテキストまたは意味を追加するためのラベルが割り当てられた生データ。 例えば、モデルの入力と出力のコンテキストを提供するために、数値に郵便番号または年齢のラベルを付けることができます。
ラージ言語モデル (LLM)
大量のテキストを使用してトレーニングされた、多数のパラメーターを持つ言語モデル。
潜在空間
データ・インスタンスが埋め込まれる n 次元の数学スペース。 2 次元の潜在空間は、データを 2D 平面内の点として埋め込みます (参照: 表現空間)。 「 Representational Space」も参照。
LLM
M
機械学習 (ML) (machine learning (ML))
人工知能 (AI) とコンピューター・サイエンスの分野の 1 つで、データとアルゴリズムを使用して人間の学習方法を模倣し、AI モデルの精度を徐々に向上させることに重点を置いています。
機械学習フレームワーク (machine learning framework)
モデルの学習およびデプロイのためのライブラリーおよびランタイム。
機械学習モデル (machine learning model)
新しいデータを分析し、そこから学習するために使用できるアルゴリズムを開発するために、一連のデータに基づいてトレーニングされる AI モデル。
メンタルモデル
システムがどのように機能し、それらのアクションがシステムの結果にどのように影響するかについての個人の理解。 これらの期待がシステムの実際の能力と一致しない場合、フラストレーション、放棄、または悪用につながる可能性があります。
調整不良
AI システムが達成するために最適化されている目標または動作と、人間のユーザーまたは設計者の真の (多くの場合複雑な) 目標との間の矛盾
ML
MLOps
- 機械学習モデルを開発から実動に移す方法論。
- 生産機械学習 (またはディープ・ラーニング) ライフサイクルの管理を支援する、データ・サイエンティストと運用専門家のコラボレーションのためのプラクティス。 MLOps は、自動化を強化し、生産 ML の品質を向上させると同時に、ビジネス要件や規制要件にも重点を置くことを目指しています。 これには、モデルの開発、トレーニング、検証、デプロイメント、モニター、および管理が含まれ、CI/CD などのメソッドを使用します。
モデル
- 機械学習のコンテキストでは、予測または意思決定を提供するために特定のデータ・セットで学習およびテストが行われた、一連の関数およびアルゴリズム。
- Decision Optimization では、さまざまなデータ・セットを使用して CPLEX 最適化エンジンで解決できる問題の数学的定式化。
ModelOps
トレーニング、デプロイメント、スコアリング、評価、リトレーニング、更新など、AI モデルのライフサイクル全体を管理するための方法。
モニタリング対象グループ
予測モデルの結果が参照グループの結果と大きく異なるかどうかを判別するためにモニターされるデータのクラス。 グループは一般に、人種、性別、年齢などの特性に基づいてモニターされます。
多クラス分類モデル
3 つ以上のクラスを持つ分類タスク。 例えば、二項分類モデルが「はい」または「いいえ」の値を予測する場合、複数クラス・モデルは「はい」、「いいえ」、「可能性」、または「適用外」を予測します。
マルチモーダル・モデル
テキスト、画像、音声などの複数のタイプのデータを処理し、それらの間で変換できる生成 AI モデル。 例えば、マルチモーダル・モデルでは、テキスト入力を取得して画像出力を生成することができます。
多変量時系列
2 つ以上の変化する変数を含む時系列実験。 例えば、3 つのクライアントの電力使用量を予測する時系列モデルがあるとします。
N
自然言語処理 (NLP) (natural language processing (NLP))
人間の言語に対するコンピューターの理解能力を向上させることを目的として自然言語の処理や操作に特有の問題を研究する、人工知能および言語学の 1 分野。
自然言語処理ライブラリー
構文分析のための基本的な自然言語処理機能、およびさまざまなテキスト処理タスクのためのすぐに使用可能な事前トレーニング済みモデルを提供するライブラリー。
ニューラル・ネットワーク
抽象化された脳細胞をシミュレートする複雑な数式を使用してケースを予測または分類するための数学モデル。 ニューラル・ネットワークの学習は、観測された多数のケースを一度に 1 つずつ提示し、ニューラル・ネットワークがタスクを学習するまで繰り返し自己更新できるようにすることで行われる。
NLP
ノード
SPSS Modeler フローにおいては、データ操作のグラフィカル表現。
ノートブック
実行可能コード、そのコードの説明テキスト、および実行されるコードの結果が記載される対話式ドキュメント。
ノートブック・カーネル (notebook kernel)
コードを実行し、計算結果を返すノートブック・エディターの一部。
O
オブジェクト・ストレージ
クラウド内で一般的に使用されるデータ保管方法の 1 つであり、ファイル階層を使用せずに、すべてのオブジェクトを同じレベルに保管する、ストレージ・プールまたはリポジトリーにデータが個別ユニットまたはオブジェクトとして保管される。
ワンショット学習
ディープ・ラーニングのモデル。ほとんどの人の学習は、1 つまたは 2 つの例を受信するだけで行われるという前提に基づいています。 このモデルは、教師なし学習に似ています。
ワンショット・プロンプト
単一の例をモデルに提供し、タスクを完了する方法を示すプロンプト技法。
オンライン・デプロイメント (online deployment)
リアルタイムでオンラインで予測を生成するために、Web サービスとして API エンドポイントを介してモデルまたは Python コード・デプロイメントにアクセスする方法。
オントロジー
関心のある領域に存在し得るオブジェクト、概念、およびその他のエンティティーと、それらの間の関係を表現するための明示的な形式の仕様。
運用アセット (operational asset)
ツールまたはジョブ内でコードを実行する資産。
最適化
課せられた制約と制限を尊重しながら、厳密に定義された問題に対する最も適切な解を見つけるプロセス。 例えば、リソースの割り振り方法を決定したり、多数の代替手段のセットから最適なエレメントまたは組み合わせを見つける方法を決定したりします。
最適化プログラミング言語
最適化問題のモデルの定式を、IBM CPLEX などの CPLEX 最適化エンジンによって解決できる形式で表すためのモデル作成言語。
最適化メトリック
モデルのパフォーマンスを測定するために使用されるメトリック。 例えば、正確度は、二項分類モデルのパフォーマンスを測定するために使用される標準的なメトリックです。
オーケストレーション
機械学習モデルのトレーニング、実行、デプロイ、テスト、および評価を行うことができ、自動化を使用してシステムを調整する (多くの場合、マイクロサービスを使用する) エンドツーエンド・フローを作成するプロセス。
過依存
AI モデルによって行われた誤った推奨をユーザーが受け入れた。 「 依存関係 (reliance)」、「 過小依存 (underreliance)」も参照。
P
パラメーター
- モデルの内部にあり、値が推定されるかデータから学習される、モデルの構成可能部分。 パラメーターは、モデルが出力を正確に予測するのに役立つように、トレーニング・プロセス中に調整されるモデルの側面です。 モデルのパフォーマンスと予測精度は、これらのパラメーターの値に大きく依存します。
- ニューラル・ネットワーク内の 2 つのニューロン間の接続の強度を示す、 0.0 から 1.0 までの実数値の重み。
通話者
統合学習において、共通モデルのトレーニングのためにデータを提供するエンティティー。 データの移動や結合は行われないが、各パーティーは統合トレーニングのメリットを享受できる。
ペイロード
スコア、予測、または解決策を取得するためにデプロイメントに渡されるデータ。
ペイロード・ロギング
ビジネス・アプリケーションにおける AI の進行中の正常性をモニターするための、ペイロード・データとデプロイメント出力のキャプチャー。
パイプライン
- Watson Pipelinesでは、アセットの作成から配備までのエンドツーエンドのフローを実現する。
- AutoAI,候補モデル。
パイプライン・リーダーボード (pipeline leaderboard)
AutoAI,では、パイプラインとして自動生成された候補モデルのリストを、指定された基準に従ってランク付けして表示する表。
ポリシー
現在の状態に基づいて次のアクションを決定するためにエージェントが従う戦略またはルール。
定位置エンコード
センテンス内の各単語の位置を含むセンテンス内の単語のエンコードなど、定位置情報を含むデータの順序付けられたシーケンスのエンコード。 「 エンコード (encoding)」も参照。
予測分析
将来の可能性および傾向の予測に関係するビジネス・プロセスおよび関連する一連のテクノロジー。 予測分析では、確率、統計、機械学習、人工知能などの多様な分野をビジネス上の問題に適用して、特定の状況に最適なアクションを見つけます。 「 データ・マイニング (data Mining)」も参照。
事前トレーニングされたモデル
特定のタスクを実行するために、以前に大規模なデータ・セットについてトレーニングされた AI モデル。 モデルを最初から作成する代わりに、事前にトレーニングされたモデルが使用されます。
事前トレーニング
特定のタスクのために機械学習モデルを微調整する前に、大きなデータ・セットで機械学習モデルをトレーニングするプロセス。
プライバシー
個人に関する情報が無許可アクセスや不適切な使用から保護されていることの保証。
確率関数
ランダム性の対象となる特性 (非決定性)。 確率的モデルでは、同じ入力が与えられても同じ出力は生成されません。 「 生成変動 (variability)」も参照。
プロジェクト
データおよびその他のアセットを処理するためのコラボレーション・ワークスペース。
プロンプト
- 基盤モデルの出力を準備、指示、または条件付けするデータ (テキストやイメージなど)。
- フィールドにユーザー入力し、出力画面へ遷移することを確認できるコンポーネント。
プロンプト・エンジニアリング
自然言語を設計するプロセスでは、特定のタスクを実行するための言語モデルのプロンプトが出されます。
プロンプトを表示する
基盤モデルに入力を提供して、基盤モデルが出力を生成するように誘導するプロセス。
プロンプトのチューニング
モデルをリトレーニングしたり重みを更新したりすることなく、事前トレーニングされたモデルを新しいタスクに適応させる効率的で低コストの方法。 プロンプトのチューニングでは、モデルの既存のパラメーターを凍結しながら、モデルのプロンプトに追加される少数の新規パラメーターを学習します。
プルーニング
デシジョン・ツリーまたはニューラル・ネットワークを単純化、縮小、またはトリミングするプロセス。 これは、重要度の低いノードまたは層を削除することによって行われ、複雑さを軽減してオーバーフィッティングを防止し、予測精度を維持しながらモデルの汎化を改善します。
Python
データ・サイエンスと AI で使用されるプログラミング言語。
Python 関数
実動のモデルをサポートする Python コードを含む関数。
Q
量子化
推論を高速化し、GPUメモリの必要量を削減するために、foundation modelの重みを圧縮する方法。
R
R
さまざまな分析、統計、およびグラフィカルの機能と技法を提供する、データ・サイエンスおよび AI で使用される拡張可能なスクリプト言語。
RAG
ランダム・シード
疑似乱数発生ルーチンを初期化するために使用される数値。 ランダム・シードは、乱数生成に依存するプロセスの再現性を有効にします。
参照グループ
予測モデルで肯定的な結果を受け取る可能性が最も高いと識別されるグループ。 結果をモニター対象グループと比較して、結果に偏りがないか調べることができます。
精製
データのクレンジングおよびシェーピングを行うこと。
回帰モデル
従属変数を 1 つ以上の独立変数に関連付けるモデル。
リインフォースメント・ラーニング
報酬信号を最大化するために環境内で順次意思決定を行うことをエージェントが学習する機械学習技法。 試行錯誤学習に触発され、担当者は環境と対話し、フィードバックを受け取り、最適なポリシーを達成するためにアクションを調整します。
人間のフィードバックに関する強化学習 (RLHF)
プロンプトで指定された命令に対して言語学習モデルの応答を調整する方法。 RLHF では、ヒューマン・アノテーターがモデルからの複数の出力をランク付けする必要があります。 これらのランキングは、強化学習を使用して報酬モデルをトレーニングするために使用されます。 その後、特典モデルを使用して、ラージ言語モデルの出力を微調整します。
依拠
AI システムにおいて、AI モデルによって作成された推奨、または AI モデルによって生成された出力をユーザーが受け入れること。 「 過大依存 (overreliance)」、「 過小依存 (underreliance)」も参照。
表現
多くの場合、実数値のベクトルとしての、情報の単位のエンコード。 「 組み込み (embedding)」も参照。
表現空間
データ・インスタンスが埋め込まれる n 次元の数学スペース。 2 次元の潜在空間は、 2D 平面内の点としてデータを埋め込みます (「潜在空間」も参照)。 「 潜在スペース (latent space)」も参照。
再ランキング
指定されたクエリに答える可能性が最も高いものから最も低いものへと、一連の文書パッセージをランク付けするための生成的AIプロセス。
検索拡張世代 (RAG)
テキストを生成するために外部ソースからの知識で大規模言語モデルを拡張する手法。 取得ステップでは、外部ソースからの関連文書がユーザーの照会から識別されます。 生成ステップでは、これらの文書の一部が LLM プロンプトに組み込まれ、取得された文書に基づいて応答が生成されます。
報酬
意思決定の良しさに関するフィードバックを提供する、エージェント (通常は強化学習エージェント) を導くために使用されるシグナル。
RLHF (A)
人間のフィードバックに関する強化学習を参照してください。
ランタイム環境
ノートブックなどのツールまたはジョブを実行するために使用される、事前定義またはカスタムのハードウェアおよびソフトウェア構成。
S
スコアリング
- 機械学習では、予測される結果の信頼度を測定するプロセス。
- 入力 ID の属性が既存のエンティティーの属性とどの程度一致しているかを計算するプロセス。
スクリプト
実動のモデルをサポートする Python または R スクリプトを含むファイル。
自己注意
入力データ自体からの情報を使用して、出力の生成時に入力のどの部分にフォーカスするかを決定するアテンション・メカニズム。
自己管理学習
入力シーケンス内のトークンをマスキングしてからそれらを予測しようとすることにより、ラベルなしデータからモデルが学習する機械学習トレーニング方式。 例えば、「I like ________ sprouts」などです。
センチメント分析
テキストで表現される感情または感情の検査。例えば、映画のレビューが肯定的か否定的かを判別します。
形状
列のフィルタリング、ソート、削除、表の結合、および計算、データ・グループ化、階層化などの操作の実行により、データをカスタマイズすること。
スモールデータ
人間がアクセスでき、理解できるデータ。 「 構造化データ (structured data)」も参照。
SQLプッシュバック
SPSS Modeler で、 SQL コードを使用してデータベースで直接さまざまなデータ準備操作やマイニング操作を実行するプロセス。
構造化データ
レコードまたはファイル内の固定フィールドにあるデータ。 構造化データの例としては、リレーショナル・データベースやスプレッドシートなどがある。 「 非構造化データ (unstructured data)」、「 小規模データ (small data)」も参照。
構造化情報
構造化リソース (検索エンジン索引、データベース、知識ベースなど) に保管されている項目。
教師あり学習
新規データの予測を行うために、ラベル付きデータ・セットでモデルがトレーニングされる機械学習トレーニング方式。
T
温度
生成プロセスのバリエーションの量を指定する、生成モデル内のパラメーター。 温度が高くなると、モデルの出力の変動が大きくなります。
テキスト分類
テキストを自動的に識別し、指定されたカテゴリーに分類するモデル。
テキスト抽出
大規模な言語モデルの入力として使用するために、高度に構造化された情報をより単純なテキスト形式に変換する生成的AI手法。
時系列
定期的なポイント・イン・タイムにおける変数の値のセット。
時系列モデル
時間の経過とともにデータを追跡して予測するモデル。
トークン
テキスト内の意味または分析の離散的な単位 (ワードやサブワードなど)。
トークン化
テキストのストリングをワードやサブワードなどの小さい単位に分割するために自然言語処理で使用されるプロセス。
学習済みモデル (trained model)
実際のデータを使用してトレーニングされ、新しいデータが提示されたときに結果を予測するためにデプロイする準備ができているモデル。
トレーニング
ソース・データのサブセットが含まれる、モデル作成の初期段階。 モデルは、既知のデータから例を挙げて学習します。 これ以後、結果が既に分かっている別のサブセットと対照するモデル・テストが可能。
研修データ
機械学習モデルの学習に使用されるデータの集まり。
トレーニング・セット
機械学習モデルを例とそれに対応するラベルに公開することによって機械学習モデルをトレーニングするために使用されるラベル付きデータのセット。これにより、モデルはパターンを学習し、予測を行うことができます。
転移学習
トレーニングされたモデルがまったく新しい問題に適用される機械学習戦略。
変圧器
定位置エンコードと自己アテンション・メカニズムを使用して、一連のトークン内の次のトークンを予測するニューラル・ネットワーク・アーキテクチャー。
透明
AI システムがどのように設計および開発されたかについて、利害関係者と適切な情報を共有する。 この情報の例としては、どのようなデータが収集され、どのように使用および保管され、誰がアクセスできるか、正確度、頑強性、およびバイアスについてのテスト結果などがあります。
トラスト・キャリブレーション
AI システムの正確性、信頼性、信頼性などの要因に基づいて、AI システムに対する信頼性を評価および調整するプロセス。
チューリング・テスト
アラン・チューリング (Alan Turing) が 1950 年に提唱した、人間と同等または区別できない知的行動を示す機械の能力のテスト。
U
過少依存
AI モデルによって行われた正しい推奨をユーザーが拒否した。 「 依存関係 (overreliance)」、「 依存関係 (reliance)」も参照。
1 変量の時系列
1 つの変化する変数のみを含む時系列実験。 例えば、温度を予測する時系列モデルには、温度の単一の予測列があります。
非構造化データ
固定のフィールドにではなく、構造化されていない形式で保管されるデータ。 ワード・プロセッシング文書のデータは、非構造化データの一例である。 「 構造化データ (structured data)」も参照。
非構造化情報
自然言語テキスト文書など、固定された場所に含まれていないデータ。
教師なし学習
- ラベルなしの生データを使用して、人的労力をほとんどまたはまったくかけずにシステムを学習することが可能な、ディープ・ラーニング用のモデル。
- モデルにラベル付きデータが提供されず、データ内のパターンまたは構造を単独で検出する必要がある機械学習トレーニング方式。
V
検証セット
トレーニング・プロセス中に機械学習モデルのパフォーマンスと汎化能力を評価するために使用されるラベル付きデータの別個のセットで、ハイパーパラメーター・チューニングおよびモデル選択を支援します。
ベクトル
[1, 2, 5] または [0.7, 0.2, -1.0] などの、1 次元の数値の番号付きリスト。
ベクトル・データベース
ベクトル指標
ベクトル・ストアからの文書のベクトル化された埋め込みを取得する索引。
ベクトル・ストア
文書のベクトル化された組み込みを保管するリポジトリー。
言語化
生成 AI において、チューニングおよび推論の際にデータをフォーマットするためのテンプレート。
仮想エージェント
自然言語を処理して単純なビジネス・トランザクションに対応したり、より複雑な要求を対象分野の専門知識を持つ人に送付したりすることができる、事前にトレーニングされたチャットボット。
可視化
グラフ、図表、プロット、表、マップ、またはその他のデータ・ビジュアル表示。
W
ウェイト
ネットワークの層の中で入力データを変換するノードの係数。 重みは、AI モデルがトレーニングを通じて学習するパラメーターであり、モデルの予測の誤差を減らすために値を調整します。
Z
ゼロ・ショット・プロンプト
モデルが具体的な方法の例を示さずにタスクを完了するプロンプト手法。