0 / 0
資料の 英語版 に戻る
資産タイプとプロパティー
資産タイプとプロパティー

資産タイプとプロパティー

資産は、データ、その他のタイプの情報、または操作コードに関するメタデータを含む項目です。 プロジェクト、カタログ、およびデプロイメント・スペースといったメイン・ワークスペースを含め、Cloud Pak for Data プラットフォーム全体で資産を操作します。

資産を理解するには、さまざまなタイプの資産、そのプロパティー、および資産がある場所を知っている必要があります。

資産のワークスペース

グローバル検索バーから検索すると、自分がコラボレーターである任意のワークスペース内の任意の資産を検索できます。 『プラットフォーム全体での資産の検索』を参照してください。

資産で行えることは、資産のタイプおよびワークスペースのタイプによって異なります。

プロジェクト データを処理するために他のユーザーとコラボレーションする場所。 例えば、プロジェクトでデータの準備、データの分析、モデルの作成を行うことができます。 プロジェクトでは、すべてのタイプの資産を作成でき、また運用資産を実行できます。 『プロジェクト』を参照してください。

カタログ 組織と共有する資産を保管する場所。 資産をカタログからプロジェクトにコピーして処理したり、プロジェクトの資産をカタログに公開したりできます。 すべてのタイプのデータ資産および一部のタイプの運用資産をカタログに公開できます。 カタログ内の資産メタデータを編集することはできますが、運用資産を実行することはできません。 『カタログ』を参照してください。

デプロイメント・スペース モデルまたはその他の資産を実動環境にデプロイする場合。 デプロイ可能な資産をプロジェクトからデプロイメント・スペースにコピーし、それらの資産からデプロイメントを作成します。 詳しくは、デプロイメント・スペースを参照してください。

データ仮想化 1 つ以上の表を結合またはセグメント化して仮想表を作成する場所。 仮想表をデータ資産としてカタログに公開します。 データの仮想化を参照してください。

データ資産

データ資産には、データへのアクセス方法など、データに関するメタデータが含まれます。

データ資産の作成方法は、データの場所によって異なります。

  • データがファイル内にある場合は、ローカル・システムからプロジェクト、カタログ、またはデプロイメント・スペースにファイルをアップロードします。
  • データがリモート・データ・ソースにある場合は、まずそのデータ・ソースへの接続を定義する接続資産を作成します。 次に、接続、パス、またはその他の構造、およびデータが含まれている表またはファイルを選択して、データ資産を作成します。 このタイプのデータ資産は、接続済みデータ資産と呼ばれます。

データ資産タイプ

ファイルからのデータ資産 ファイルからのデータ資産は、ローカル・システムからアップロードしたファイルを指します。 ファイルは、プロジェクト、カタログ、またはデプロイメント・スペースに関連付けられている IBM Cloud Object Storage インスタンス上のオブジェクト・ストレージ・コンテナーに保管されます。 ファイルの内容には、構造化データ、非構造化テキスト・データ、イメージ、およびその他のタイプのデータを含めることができます。 任意の形式のファイルを使用してデータ資産を作成できます。 ただし、CSV ファイルでは、他のファイル・タイプよりも多くのアクションを実行できます。

接続済みデータ資産 接続されたデータ資産は、リモート・データ・ソースへの接続を介してアクセスされる表、ファイル、またはフォルダーを指します。 接続は、接続済みデータ資産に関連付けられている接続資産で定義されます。 接続済みデータ資産にアクセスすると、データはデータ・ソースから動的に取得されます。

フォルダー・データ資産は、接続済みデータ資産の特殊なケースです。 これは、IBM Cloud Object Storage 内のフォルダーを指します。 フォルダーのパスおよび IBM Cloud Object Storage 接続資産を指定して、フォルダー・データ資産を作成します。 フォルダー・データ資産とパスを共有するファイルおよびサブフォルダーを表示できます。 フォルダー・データ資産内で表示できるファイルは、それ自体はデータ資産ではありません。 例えば、継続的に更新されるニュース・フィードを含むパスのフォルダー・データ資産を作成できます。

接続資産 接続資産は、データ資産のタイプの 1 つと見なされます。 データ・ソースへの接続の作成に必要な情報が含まれています。 使用する接続資産にアクセスできるすべてのユーザー用に共有資格情報を提供することを選択できます。あるいは、各ユーザーが接続を使用する際に自分の個人資格情報を入力しなければならないように指定することもできます。 プロジェクトおよびカタログは、 IBM とサード・パーティー・データ・ソースの両方に対して、多くの 接続タイプ をサポートします。

『プロジェクトへのデータの追加』『カタログへの資産の追加』、および 『デプロイメント・スペースへのデータ資産の追加』を参照してください。

運用資産

運用資産とは、データの準備、データの分析、モデルの作成を行うためのツールを使用して、プロジェクト内のデータを処理する方法です。 プロジェクトでツールを使用して運用資産を作成します。 例えば、Jupyterノートブックは、データを分析するためにノートブック・エディター・ツールを使用して作成できる運用資産です。

運用資産の実行

運用資産を実行する際には、計算リソースを使用します。 計算リソースは、キャパシティー・ユニット時間 (CUH) 単位で測定され、追跡されます。 サービスのプランに応じて、1 カ月当たりの CUH の量の制限があったり、1 カ月当たりの設定されている CUH の量を超過した場合に追加料金が発生したりすることがあります。

多くの運用資産では、使用する計算環境構成を選択できます。 通常、大規模で高速な環境構成では、計算リソースがより高速に消費されます。 環境を参照してください。

運用資産を実行するたびに、その資産はジョブと見なされます。 ジョブをモニターおよびスケジュールできます。 ジョブを参照してください。

運用資産のタイプ

多くの運用資産がコア・サービスで提供されています。 ただし、一部の運用資産では他のサービスが必要です。

追加のサービスなしで、以下のタイプの運用資産を作成できます。

以下の運用資産では、その他のサービスが必要です。 各サービスは、そのサービスを必要とする最初の資産を作成するときにプロビジョンできます。

  • DataStage フロー: DataStage ツールを使用してデータ変換ジョブを作成します。 DataStage サービスが必要です。
  • ダッシュボード: コーディングをすることなく、ダッシュボード・エディターでデータを視覚化します。 Cognos Dashboards サービスが必要です。

Watson Knowledge Catalog サービスに Watson Studioがない場合は、 Data Refinery フロー、メタデータ・インポート資産、およびメタデータ・エンリッチ資産を作成できます。

構成資産

構成資産は、他の資産またはジョブを構成するための、プロジェクト内の再使用可能なテンプレートです。

DataStage サービスを使用して、以下のタイプの構成資産を作成できます:

  • DataStage サブフロー で、ステージとコネクターのセットを収集し、DataStageのフローで再利用することができます。
  • データ定義 は、 DataStage フロー・ジョブで再使用するデータ資産の列メタデータを指定します。
  • パラメーター・セット は、ジョブで再使用するために、指定された値を持つ複数のジョブ・パラメーターを収集します。

資産プロパティー、メタデータ、および関係

すべての資産には、どこでも表示される共通メタデータがあります。 その他の資産プロパティーは、資産のタイプおよび資産の場所によって異なります。

共通のプロパティー

すべての資産には、プロジェクト、カタログ、およびデプロイメント・スペースで表示および編集可能な共通のプロパティーがあります。

名前 最大 100 文字を使用できます。 マルチバイト文字がサポートされます。 空にすること、Unicode 制御文字を含めること、およびブランク・スペースのみを含めることはできません。 資産名は、プロジェクトまたはデプロイメント・スペース内で固有である必要はありません。 資産名がカタログ内で固有でなければならないかどうかは、カタログに設定されている重複処理方式によって決まります。

説明オプション。 最大 245 文字にすることができます (ブランク・スペースは含まれません)。 マルチバイト文字およびハイパーリンクがサポートされます。

自動的に生成または検出されたメタデータには、資産タイプに応じて、他の情報 (追加日、サイズ、作成者、最終編集者、最終変更日時、スケジュール済みか、共有されているか、言語、モデル・タイプ、状況など) が含まれることがあります。

一部のアセット・タイプにはタグを付けることができます。タグは管理対象外のメタデータであり、アセットの検索が容易になります。 タグに含めることができるのは、ブランク・スペース、文字、マルチバイト文字、数字、下線、ダッシュ、および記号 # と @ のみです。 管理者またはエディターの役割を備えているプロジェクト、カタログ、またはデプロイメント・スペースのコラボレーターは、タグを作成して資産に追加できます。

資産の詳細情報

資産は、より多くのプロパティー、関係、およびメタデータを持つことができます。

資産プライバシーデフォルトでは public に設定されます。 この設定は、カタログ内の資産が private に設定されている場合に、その資産へのアクセスを制限できます。 プライベート資産を表示および使用できるのは、資産の所有者とメンバーのみです。

資産所有者および資産メンバー デフォルトでは、資産所有者は、資産をカタログに追加したユーザーです。 資産メンバーは、private のマークが付けられている資産を表示および使用できます。

ガバナンス成果物 資産所有者またはデータ・スチュワードによって自動的に割り当てることができます。 ガバナンス成果物は、メタデータおよび関係を資産に追加したり、データ資産内の機密データをマスクしたりすることができます。 一般的に、この情報はカタログで入手できます。 一部の資産タイプでは、この情報はプロジェクトでも使用できます。

カスタム属性 オプション。 カスタム属性は、カタログ内の資産の 「概要」 タブの 「詳細」 セクションに表示されます。 API を使用して資産のカスタム属性を作成できます。

資産のプレビュー 資産の プレビュー 。 プレビューに表示されるコンテンツは、資産、ファイル、またはデータのタイプによって異なります。

レビューと評価 すべてのカタログ・コラボレーターが資産を評価およびレビューできます。

データ資産の追加情報

データ資産のデータの形式によっては、資産を開いたときに追加情報が表示されます。

データへのパス データにアクセスするために必要な情報。 データベース内の表の接続済みデータ資産には、データベースの接続資産への参照、スキーマまたはその他のパス情報、および表名が含まれています。 アップロードされたファイルのデータ資産には、プロジェクト、カタログ、またはデプロイメント・スペースのオブジェクト・ストレージ・コンテナー内のファイル・ロケーションへの参照が含まれています。

ファイル形式 ファイルの MIME タイプです。 自動的に検出されます。

データ・プロファイル CSV、TSV、Avro、Parquet、Microsoft Word、Microsoft Excel (ワークブックの最初のシートのみ)、PDF、テキスト、および HTML の各ファイルのほか、リレーショナル・データ・ソースからのデータの プロファイル

活動 プロジェクトおよびカタログ内の資産に対して実行された アクティビティー の履歴。アクティビティーを表示できるかどうかは、 Watson Knowledge Catalog オファリング・プランによって異なります。

もっと見る

親トピック: IBM Cloud Pak for Data as a Service