プラットフォームは、コラボレーション・ワークスペースとツールを提供し、アセットの形式でコンテンツをプラットフォームに提供します。 資産 とは、データに関する情報、その他の価値ある情報、またはデータを処理するコードを含む項目です。
資産を追加するには、資産をインポートするか、ツールを使用して資産を作成します。 コラボレーション・ワークスペースで資産を処理します。 使用するワークスペースは、タスクによって異なります。
プロジェクト : データを処理したり資産を作成したりするために他のユーザーとコラボレーションします。 ほとんどのツールはプロジェクト内にあり、プロジェクト内のコードを含む資産を実行します。 例えば、データのインポート、データの準備、データの分析、プロジェクトでのモデルの作成を行うことができます。 『プロジェクト』を参照してください。
カタログ : 組織と共有するために資産を保管したり、作業する必要がある資産を検索したりすることができます。 カタログからプロジェクトに資産をコピーしたり、プロジェクトからカタログに資産を公開したりすることができます。 カタログ内の資産プロパティーおよびメタデータを編集することはできますが、資産を実行することはできません。 『カタログ』を参照してください。
デプロイメント・スペース テストまたは実稼働の準備ができている資産をデプロイして実行する場所。 資産をプロジェクトからデプロイメント・スペースに移動してから、それらの資産からデプロイメントを作成します。 必要に応じて、デプロイメントをモニターおよび更新します。 詳しくは、デプロイメント・スペースを参照してください。
グローバル検索バーから検索すると、自分がコラボレーターである任意のワークスペース内の任意の資産を検索できます。 『プラットフォーム全体での資産の検索』を参照してください。
さまざまなタイプのアセットを作成できますが、すべてのアセットに共通のプロパティーがいくつかあります。
資産タイプ
ほとんどのタイプの資産を作成するには、特定のツールを使用する必要があります。 ほとんどのツールは、1 つ以上のサービスによって提供されます。 データ資産および接続資産を作成するためのツールは、プラットフォームによって提供され、特定のサービスを必要としません。
ツールに必要なサービスを確認するには、ツールとサービス・マップを開きます。
以下の表に、作成できる資産のタイプ、資産を作成するために必要なツール、および資産を追加できるワークスペースをリストします。
資産タイプ | 説明 | 作成するツール | ワークスペース |
---|---|---|---|
AutoAI エクスペリメント | 候補の予測モデル・パイプラインを自動的に生成します。 | AutoAI | プロジェクト |
COBOL コピーブック | z/OS メインフレーム・コンピューターからの接続済みデータ資産のマップ・メタデータを表示します。 | Metadata import ツール | プロジェクト、カタログ |
接続済みデータ資産 | リモート・データ・ソースへの接続を介してアクセスされるデータを表します。 | 接続済みデータ・ツール、 Metadata import ・ツール | プロジェクト、カタログ、スペース |
接続 | データ・ソースに接続するための情報が含まれます。 | 接続ツール | プロジェクト、カタログ、スペース |
ファイルからのデータ資産 | ローカル・システムからアップロードしたファイルを表します。 | 「アップロード」ペイン | プロジェクト、カタログ、スペース |
Data Refinery フロー | データを準備します。 | Data Refinery | プロジェクト、スペース |
Data Replication フロー | データを複製します。 | Data Replication | プロジェクト、カタログ |
データ品質定義 | データ品質規則の再使用可能な規則論理コンポーネントを定義します。 | データ品質定義エディター | プロジェクト、カタログ |
データ品質ルール | 特定の条件のデータ品質を評価する。 | データ品質ルール・エディター | プロジェクト |
DataStage データ定義 | DataStage フロー・ジョブの再使用可能な列メタデータ・コンポーネントを定義します。 | DataStage コンポーネント・エディター | プロジェクト、スペース |
DataStage フロー | データを変換して統合します。 | DataStage フロー・エディター | プロジェクト、スペース |
DataStage スキーマライブラリー | DataStage フローの再使用可能なリソース・セットをインポートします。 | DataStage コンポーネント・エディター | プロジェクト、スペース |
DataStage 標準化ルール | DataStage フローでデータをフォーマットするための再使用可能な規則コンポーネントを定義します。 | DataStage コンポーネント・エディター | プロジェクト、スペース |
DataStage サブフロー | DataStage フローの再使用可能なステージおよびコネクターのセットを定義します。 | DataStage コンポーネント・エディター | プロジェクト、スペース |
意思決定最適化のエクスペリメント | 最適化の問題を解決する。 | Decision Optimization | プロジェクト |
動的ビュー (Dynamic View) | リモート・データ・ソースへの接続を介してアクセスされ、SQL 照会によってフィルタリングされるデータを表します。 | クエリー・ツール | プロジェクト |
統合学習エクスペリメント | Trains a common model on a set of remote data sources. | 統合学習 | プロジェクト |
フォルダー資産 | IBM Cloud Object Storage 内のフォルダを表します。 | 接続されたデータ・ツール | プロジェクト、カタログ、スペース |
Jupyter ノートブック | Python または R コードを実行して、データを分析したり、モデルを作成したりします。 | Jupyterノートブックエディタ、AutoAI,プロンプト・ラボ | プロジェクト、カタログ |
マスキング・フロー | データ資産のマスクされたコピーを作成します。 | マスキング・フロー | プロジェクト |
マスター・データ構成 | Match 360を構成します。 | Match 360 | プロジェクト |
メタデータのエンリッチメント | インポートされた資産メタデータをエンリッチします。 | メタデータ・エンリッチ・ツール | プロジェクト |
Metadata import | 接続から資産メタデータをインポートします。 | Metadata import ツール | プロジェクト |
モデル | 保存またはインポートされたモデルに関する情報が含まれます。 | 実験やモデルのトレーニングを行う各種ツール | プロジェクト、カタログ、スペース |
物理制約 | データ資産の主キー制約または外部キー制約を表します。 | キー関係を含むメタデータ・エンリッチメント結果が公開されると自動的に作成されます | カタログ |
パイプライン | モデルのライフサイクルを自動化します。 | オーケストレーション・パイプライン | プロジェクト |
Python 関数 | 実動のモデルをサポートする Python コードが含まれています。 | Jupyter ノートブック・エディター | プロジェクト、スペース |
script | 実動のモデルをサポートする Python または R スクリプトが含まれています。 | Jupyter ノートブックエディタ、RStudio | プロジェクト、スペース |
SPSS Modeler フロー | フローを実行してデータを準備し、モデルを作成します。 | SPSS Modeler | プロジェクト |
視覚化 | データ資産からの視覚化を表示します。 | データ資産の 「視覚化」 ページ | プロジェクト |
アセットの共通プロパティー
資産は、作成時、使用時、または自動化プロセスによる更新時に、プロパティーに情報を蓄積します。 一部のプロパティーはユーザーによって提供され、ユーザーが編集できます。 その他のプロパティーは、システムによって自動的に提供されます。 ほとんどのシステム提供プロパティーは、ユーザーが編集することはできません。
資産の 「最終変更日時」 フィールドは、ユーザー・アクションとシステム・アクションの両方を追跡します。 多くの場合、システム・アクションはバックグラウンドで実行され、資産の内部メタデータの変更のみを伴う可能性があります。
あらゆる場所にある資産の共通プロパティー
ほとんどのタイプの資産には、それらの資産タイプが存在するすべてのワークスペースにおいて、以下の表にリストされているプロパティーがあります。
プロパティー | 説明 | 編集可能? |
---|---|---|
名前 | 資産名。 最大 255 文字を使用できます。 マルチバイト文字がサポートされます。 空にすること、Unicode 制御文字を含めること、およびブランク・スペースのみを含めることはできません。 資産名は、プロジェクトまたはデプロイメント・スペース内で固有である必要はありません。 資産名がカタログ内で固有でなければならないかどうかは、カタログに設定されている重複処理方式によって決まります。 | はい |
説明 | オプション。 マルチバイト文字およびハイパーリンクがサポートされます。 | はい |
作成日 | 資産が作成またはインポートされたときのタイム・スタンプ。 | いいえ |
作成者または所有者 | 資産を作成またはインポートした個人のユーザー名または E メール・アドレス。 | いいえ |
最終変更日時 | 資産が最後に変更されたときのタイム・スタンプ。 | いいえ |
最終編集者 | 資産を最後に変更した個人のユーザー名または E メール・アドレス。 | いいえ |
カタログ内の資産の共通プロパティー
カタログ内の資産には、すべての資産が持つ共通プロパティーに加えて、以下の表にリストされているプロパティーとページがあります。
プロパティーまたはページ | 説明 | 編集可能? |
---|---|---|
「 アセット 」ページ | アセットの内容のビュー。 「 アセットの内容またはプレビュー」を参照してください。 | いいえ |
プライバシー | デフォルトでは、公開に設定されています。 この設定をプライベートに設定すると、カタログ内の資産へのアクセスを制限できます。 プライベート資産を表示および使用できるのは、資産の所有者とメンバーのみです。 | はい |
「アクセス」 ページ | 資産の所有者とメンバー。 デフォルトでは、資産所有者は、資産をカタログに追加したユーザーです。 アセット・メンバーは、非公開のマークが付けられているアセットを表示および使用できます。 カタログの資産へのアクセスの制御を参照してください。 | はい |
「レーティング」 ページ | オプション。 カタログ・コラボレーターは、資産の評価とレビューを行うことができます。 | はい |
タグ | オプション。 カタログ・コラボレーターが検索を簡素化するために作成するテキスト・ラベル。 タグは、255 文字までの 1 つのストリングで構成されます。 このストリングには、スペース、文字、数字、下線、ダッシュ、および # 記号と @ 記号を含めることができます。 | はい |
関係 | オプション。 アセットの 「概要」 ページの 「関連項目」 セクションに表示される関係は通知用であり、アセットに対してその他の影響はありません。 同じワークスペース内の資産の間でも、異なるワークスペースの資産の間でもかまいません。 例えば、カタログ内の資産とプロジェクト内の資産の間の関係を追加できます。 アセットと成果物の間にすることができます。 例えば、アセットとポリシーの間の関係を追加できます。 管理者は、資産のカスタム関係を作成できます。 資産関係の追加を参照してください。 | はい |
ガバナンス成果物 | オプション。 ユーザーによって資産に割り当てられたビジネス用語と分類。 これらの割り当ては資産に影響する可能性があります。 例えば、割り当てられたビジネス用語は、データ保護ルールの適用をトリガーできます。 | はい |
資産タイプのカスタム・プロパティーを作成できます。 カスタム・プロパティーは、カタログ内の資産の 「概要」 タブの 「詳細」 セクションに表示されます。 「 カスタム・プロパティーおよび関係」を参照してください。
資産プロパティーを編集するには、必要な権限が必要です。 「 カタログ内の資産の編集」を参照してください。
ツールで実行される資産の共通プロパティー
一部の資産は、ツールの実行に関連付けられています。 例えば、 AutoAI エクスペリメント資産は AutoAI ツールで実行されます。 ツールで実行される資産は、運用資産とも呼ばれます。 ツールで資産を実行するたびに、ジョブを開始します。 ジョブをモニターおよびスケジュールできます。 ジョブはコンピュート・リソースを使用します。 計算リソースは、キャパシティー・ユニット時間 (CUH) 単位で測定され、追跡されます。 サービス・プランに応じて、1 カ月あたりの CUH の量を制限したり、毎月使用する CUH の料金を支払うことができます。
ツールで実行される多くの資産について、使用する計算環境構成を選択できます。 通常、大規模で高速な環境構成では、計算リソースがより高速に消費されます。
基本プロパティーに加えて、ツールで実行されるほとんどの資産には、プロジェクト内の以下のタイプの情報が含まれています。
プロパティ- | 説明 | 編集可能? | ワークスペース |
---|---|---|---|
環境定義 | 資産を実行するための環境テンプレート、ハードウェア仕様、およびソフトウェア仕様。 環境を参照してください。 | はい | プロジェクト、スペース |
設定 | 資産の実行方法を定義する情報。 各タイプの資産に固有です。 | はい | プロジェクト |
関連付けられたデータ資産 | アセットが処理しているデータ。 | はい | プロジェクト |
ジョブ | 環境定義、スケジュール、および通知オプションを含む、アセットの実行方法に関する情報。 『ジョブ』を参照してください。 | はい | プロジェクト、スペース |
データ資産タイプとそのプロパティー
データ資産タイプには、メタデータおよびデータに関するその他の情報 (データへのアクセス方法を含む) が含まれます。
データ資産の作成方法は、データの場所によって異なります。
データがファイル内にある場合は、ローカル・システムからプロジェクト、カタログ、またはデプロイメント・スペースにファイルをアップロードします。
データがリモート・データ・ソースにある場合は、まずそのデータ・ソースへの接続を定義する接続資産を作成します。 次に、接続、パスまたはその他の構造、およびデータを含む表またはファイルを選択して、データ資産を作成します。 このタイプのデータ資産は、接続済みデータ資産と呼ばれます。
SQL 照会をサポートするデータ・ソースの場合、 「照会」タイプのデータ資産である 動的ビューを作成することもできます。 このような資産を作成するには、接続を選択し、必要なデータのみを取得する SQL 照会を指定します。
以下の図は、ファイルからのデータ資産が Cloud Object Storage内のアップロードされたファイルをどのように指すかを示しています。 接続されたデータ資産は、接続資産を必要とし、リモート・データ・ソース内のデータを指します。
プロジェクト、カタログ、またはデプロイメント・スペースには、以下のタイプのデータ資産を作成できます。
ファイルからのデータ資産 ローカル・システムからアップロードしたファイルを表します。 ファイルは、ワークスペースに関連付けられている IBM Cloud Object Storage インスタンスのオブジェクト・ストレージ・コンテナに格納されます。 ファイルの内容には、構造化データ、非構造化テキスト・データ、イメージ、およびその他のタイプのデータを含めることができます。 任意の形式のファイルを使用してデータ資産を作成できます。 ただし、CSV ファイルに対しては、他のファイル・タイプよりも多くのアクションを実行できます。 データ資産のプロパティーを参照してください。
ワークスペースにファイルをアップロードすることで、ファイルからデータ資産を作成できます。 また、ツールを使用してデータ・ファイルを作成し、それらを資産に変換することもできます。 たとえば、Data Refinery、Jupyterノートブック、および RStudio ツールを使用して、ファイルからデータ資産を作成できます。
接続済みデータ資産 リモート・データ・ソースへの接続を介してアクセスされる表、ファイル、またはフォルダーを表します。 接続は、接続済みデータ資産に関連付けられている接続資産で定義されます。 サポートされるすべての接続について、接続されたデータ資産を作成できます。 接続済みデータ資産にアクセスすると、データはデータ・ソースから動的に取得されます。 データ資産のプロパティーを参照してください。
ワークスペース内の接続されたデータ・ツールを使用して、接続されたデータ資産をデータ・ソースからインポートできます。 接続されたデータ資産のセット (データベース・スキーマ全体など) をインポートする場合は、プロジェクトでメタデータ・インポート・ツールを使用します。 Data virtualization ワークスペースの Data Virtualization を使用して、複数のデータ・ソースからのデータをコンパイルする仮想表を作成できます。
プロジェクトでは、照会データ・アクセス・ツールを使用して、データ・ソース内の 1 つ以上の表からのフィルター済みデータを含む動的ビューを作成できます。
フォルダー・アセット IBM Cloud Object Storage 内のフォルダーを表します。 フォルダー・データ資産は、接続されたデータ資産の特殊なケースです。 フォルダーのパスおよび IBM Cloud Object Storage 接続資産を指定して、フォルダー・データ資産を作成します。 フォルダー・データ資産とパスを共有するファイルおよびサブフォルダーを表示できます。 フォルダー・データ資産内で表示できるファイルは、それ自体はデータ資産ではありません。 例えば、継続的に更新されるニュース・フィードを含むパスのフォルダー・データ資産を作成できます。 データ資産のプロパティーを参照してください。
ワークスペースの接続データ ツールを使用して、IBM Cloud Object Storage からフォルダー アセットをインポートできます。
接続資産 データ・ソースへの接続を作成するために必要な情報が含まれています。 「 接続資産のプロパティー」を参照してください。
ワークスペースで接続ツールを使用して接続を作成できます。
データ資産の作成とインポートについて詳しくは、以下を参照してください。
ファイルおよび接続されたデータ資産からのデータ資産のプロパティー
基本プロパティーおよび共通カタログ・プロパティーに加えて、ファイルからのデータ資産および接続されたデータ資産には、以下の表にリストされているプロパティーまたはページがあります。
プロパティーまたはページ | 説明 | 編集可能? | ワークスペース |
---|---|---|---|
列 | データ資産にある列のプロパティーの要約。 各列の品質スコア、説明、割り当てられたデータ・クラス、および割り当てられたビジネス用語が含まれます。 割り当てられたデータ・クラスおよびビジネス用語は、資産に影響を与える可能性があります。 例えば、割り当てられたビジネス・タームは、データ保護ルールの実施をトリガーすることができます。 プライマリ・キーおよびキー・リレーション情報: - プライマリ・キーとして設定されたカラムは、キー・アイコン()で識別されます。 - プライマリ・キーは資産サイド・パネルにも表示されます 資産のキー関係が存在する場合は、 「キー関係の表示」 リンクをクリックできます。 「親」 タブに、主キーのすべての関係が表示されます。 「下位階層」 タブには、資産に外部キーが含まれているすべての関係が表示されます。 |
いいえ | カタログ |
タグ | オプション。 検索を簡素化するためにユーザーが作成するテキスト・ラベル。 タグは、255 文字までの 1 つのストリングで構成されます。 このストリングには、スペース、文字、数字、下線、ダッシュ、および # 記号と @ 記号を含めることができます。 | はい | プロジェクト、カタログ |
フォーマット | ファイルの MIME タイプ。 自動的に検出されます。 | はい | プロジェクト、カタログ、スペース |
資産詳細 | データのサイズ、列と行の数、および資産バージョンに関する情報。 プロジェクトでは、リレーショナル・データのテーブル・タイプも表示されます。 |
いいえ | プロジェクト、カタログ、スペース |
ソース | ストレージ内のデータ・ファイル、またはデータ・ソースと接続に関する情報。 | いいえ | カタログ、スペース |
照会 | アセットを生成する SQL 照会。 動的ビューのみ。 |
はい | プロジェクト |
接続の詳細 | 接続されたデータ資産の場合は、パス、接続名、コネクターのタイプ、および接続所有者が表示されます。 動的ビューの場合は、接続名とコネクター・タイプのみが表示されます。 |
いいえ | プロジェクト |
「アクティビティー」ペイン | すべてのワークスペースで資産に対して実行されたアクションの履歴。 「 アクティビティー」を参照してください。 | いいえ | プロジェクト、カタログ |
「資産のプレビュー」 または 「資産」 ページ | 元のデータ・ソースからの限定された列と行のセットを含むデータのプレビュー。 「 アセットの内容またはプレビュー」を参照してください。 | いいえ | プロジェクト、カタログ、スペース |
「プロファイル」 ページ | データの内容に関するメタデータおよび統計。 たとえば、セマンティックにエンリッチされたアセットがカタログに公開されると、拡張メタデータも公開され、表示名と説明(AIが生成した名前または編集されたバージョン)がこのページに表示されます。 この情報は、概要ページにも掲載されている。 プロフィールを参照。 | はい | プロジェクト、カタログ |
「データ品質」 ページ | 資産とその列のデータ品質に関する情報、および適用されたデータ品質チェックに関する情報。 データ品質 (Data quality)を参照。 | はい [1] | プロジェクト、カタログ |
「視覚化」 ページ | ユーザーがデータを理解するために作成するチャートおよびグラフ。 視覚化を参照してください。 | はい | プロジェクト |
「 フィーチャー・グループ 」ページ | データ資産内のどの列がモデルの特徴量として使用されるかに関する情報。 機能グループの管理を参照してください。 | はい | プロジェクト、カタログ、スペース |
接続資産のプロパティー
接続資産のプロパティーは、接続の作成時に選択したデータ・ソースによって異なります。 接続タイプを参照してください。 ほとんどのデータ・ソースの接続資産には、以下の表にリストされているプロパティーがあります。
プロパティ- | 説明 | 編集可能? | ワークスペース |
---|---|---|---|
接続の詳細 | データ・ソースを識別する情報。 例えば、データベース名、ホスト名、IP アドレス、ポート、インスタンス ID、バケット、エンドポイント URL などがあります。 | はい | プロジェクト、カタログ、スペース |
資格情報設定 | 資格情報がプラットフォーム間で共有されるか (デフォルト)、または各ユーザーが個人の資格情報を入力する必要があります。 すべてのデータ・ソースが個人資格情報をサポートするわけではありません | はい | プロジェクト、カタログ、スペース |
認証方式 | 資格情報情報の形式。 例えば、API キーやユーザー名とパスワードなどです。 | はい | プロジェクト、カタログ、スペース |
資格情報 | データ・ソースおよび指定された認証方式によって要求されるユーザー名とパスワード、API キー、またはその他の資格情報。 | はい | プロジェクト、カタログ、スペース |
証明書 | データ・ソース・ポートが SSL 接続および SSL 証明書に関するその他の情報を受け入れるように構成されているかどうか。 | はい | プロジェクト、カタログ、スペース |
プライベート接続 | インターネットに外部化されていないデータベースに接続するためのメソッド。 ファイアウォールの内側にあるデータへの接続を参照してください。 | はい | プロジェクト、カタログ、スペース |
位置と主権 | データが保管されているデータ・センターと、データを管轄するソブリン・エンティティーの物理的な場所。 | はい | プロジェクト、カタログ、スペース |
もっと見る
親トピック IBM Cloud Pak for Data as a Serviceの概要
プロジェクトのみ ↩︎