IBM
Cloud Pak for Data
IBM
Cloud Pak for Data
Log In
Sign Up
Branch
Pull
0
Commit
0
Push
0
Checkout branch
Merge conflict
Commit history
Git preferences
Pull and push
Pull only
Migrate
New
Add
New
Add
Analytics project
Data Transform project
Launch IDE
JupyterLab
RStudio
Project terminal
Add to project
Add
Add to project
Add
Connected assets
Notebook
Connection
Data asset
Scheduled job
Model
Function
BETA
Synthesized neural network
BETA
Experiment
BETA
Streams flow
BETA
Modeler flow
Dashboard
Data Refinery flow
Environment
Visual recognition model
Natural language classifier model
Application
Fork Project
Export
Download
Roadmap
0 / 0
Confirm
Do you want to log out?
情報の検索
Cloud Pak for Data as a Service
新機能
サービス・プランの変更と非推奨
2019 年の新機能
2018 年の新機能
2017 年の新機能
IBM Cloud Pak for Data as a Service の概要
サービス間の関係
Cloud Pak for Data の各デプロイメント間の比較
オファリング・プラン
機能マトリックス
既知の問題と制約
リージョンの制限事項
FAQ
サービス用の API
セキュリティー
データのセキュリティーおよび準拠性の保持
外部サイトへのアクセスの制限
サービス・エンドポイントでのサービスへの接続の保護
特記事項
アクセシビリティー
サービスと統合
IBM Cloud サービス
サービスの作成
Watson Studio
Watson Studio のオファリング・プラン
Watson Knowledge Catalog
Watson Knowledge Catalog のオファリング・プラン
Watson Machine Learning
Machine Learning のオファリング・プラン
Analytics Engine
Cloudant
Cloud Object Storage
Cognos Dashboard Embedded
Databases for EDB
Databases for MongoDB
Databases for PostgreSQL
DataStage (ベータ版)
Db2
Db2 Warehouse
Match 360 with Watson (ベータ版)
セキュア・ゲートウェイ
SQL 照会
Streaming Analytics
Visual Recognition
Watson Assistant
Watson Discovery
Watson Natural Language Understanding
Watson Language Translator
Watson Natural Language Classifier
Watson OpenScale
Watson Personality Insights
Watson Speech to Text
Watson Text to Speech
Watson Tone Analyzer
その他のクラウド・プラットフォームとの統合
AWS との統合
Azure との統合
Google との統合
Satellite ロケーション
始めに
ビデオ
個人アカウントの登録
組織のアカウントへの参加
組織のアカウントのセットアップ
ユーザーの役割と権限
エンドツーエンドの例: 業界アクセラレーター
資産タイプとプロパティー
プロファイル
プレビュー
アクティビティー
資産の検索
ツールの選択
ロール
追加リソース
プロジェクト
プロジェクトの作成
オブジェクト・ストレージ
プロジェクトのインポート
プロジェクトの管理
コラボレーターの管理
プロジェクト・コラボレーター役割
関連付けられているサービスの追加
プロジェクトのエクスポート
プロジェクト内の資産の管理
環境
ノートブック環境
Spark 環境
Satellite ロケーションの環境
Data Refinery 環境
DataStage 環境 (技術プレビュー)
RStudio 環境
GPU 環境
環境の管理
環境の作成
環境のカスタマイズ
カスタマイズの例
アクティブ・ランタイムの停止
ランタイム使用量
ジョブ
プロジェクトへのカタログ資産の追加
プロジェクトからの離脱
マークダウンの虎の巻
データの準備
プロジェクトへのデータの追加
プロジェクトへの非常に大容量のファイルの追加
プロジェクトへの接続の追加
COS バケットへのアクセスの制御
接続からのデータの追加
接続からのフォルダー資産の追加
メタデータのインポート
接続タイプ
Amazon RDS for MySQL 接続
Amazon RDS for PostgreSQL 接続
Apache Cassandra 接続
Box 接続
Elasticsearch 接続
HTTP 接続
IBM Cloud Object Storage 接続
IBM Cloud Object Storage (インフラストラクチャー) 接続
IBM Cognos Analytics 接続
IBM Data Virtualization Manager for z/OS 接続
IBM Db2 接続
IBM Db2 Event Store 接続
IBM Planning Analytics 接続
MariaDB 接続
Microsoft Azure Blob Storage 接続
Microsoft Azure Cosmos DB 接続
Microsoft Azure Data Lake Store 接続
Microsoft Azure File Storage 接続
MongoDB 接続
MySQL 接続
OData 接続
Oracle 接続
PostgreSQL 接続
Salesforce.com 接続
SAP OData 接続
Snowflake 接続
プラットフォーム接続の追加
データ資産のダウンロード
データの精製
Data Refinery へのデータの追加
データのフォーマットの指定
データの検証
データの視覚化
Data Refinery フローの管理
ソースからターゲットへのデータのコピー
GUI 操作
対話式コード・テンプレート
チュートリアル: 生データのシェーピング
データ・アノテーション
Figure Eight によるデータの注釈付け
DefinedCrowd によるデータの注釈付け
マスター・データの管理 (ベータ)
「始めに」チュートリアル
IBM Match 360 with Watson に対するアクセス権限のユーザーへの付与
マスター・データの構成
データ・モデルのカスタマイズ
データの追加およびデータ・モデルへのマッピング
マスター・データ・エンティティーを作成するためのデータのマッチング
IBM Match 360 with Watson ジョブの管理
マッチング・アルゴリズムのカスタマイズと強化
マスター・データの探索
レコードおよび属性の表示方法の定義
マスター・データ・エンティティーおよびレコードの探索
個々のレコードの追加および編集
マスター・データのエクスポート
IBM Match 360 with Watson API の概要
DataStage
Adding data to IBM DataStage
Creating a DataStage flow
Downloading and importing a DataStage flow and its dependencies
DataStage connectors
Asset browser
Data set
File set
Input tab
Output tab
Lookup file set
Sequential file
Defining data definitions
Making parts of your job design reusable
Local subflows
Subflows
Making jobs adaptable
Creating and using parameters and parameter sets
Inserting parameters and parameter sets as properties
Migrating DataStage jobs
DataStage stages
Aggregator
Fast path
Stage tab
Calculation and recalculation dependent properties
Input tab
Output tab
Bloom Filter
Stage tab
Input tab
Output tab
Change Apply
Example data
Fast path
Change Capture
Fast path
Stage tab
Input tab
Output tab
Checksum
Adding a Checksum column to your data
Properties for Checksum Stage
Mapping output columns
Specifying execution options
Column Export
Fast path
Stage tab
Input tab
Format section
Output tab
Column Generator
Fast path
Stage tab
Input tab
Output tab
Column Import
Examples
Fast path
Stage tab
Input tab
Output tab
Output link format section
Combine Records
Examples
Example 1
Example 2
Fast path
Stage tab
Properties section
Outputs section
Combine keys section
Options section
Advanced section
NLS Locale section
Input tab
Partitioning and collecting data
Output tab
Compare
Fast path
Stage tab
Input tab
Output tab
Compress
Fast path
Stage tab
Input tab
Output tab
Copy
Fast path
Stage tab
Input tab
Output tab
Decode
Fast path
Input tab
Output tab
Difference
Fast path
Stage tab
Input tab
Output tab
Encode
Fast path
Stage tab
Input tab
Output tab
Expand
Fast path
Stage tab
Input tab
Partitioning and collecting data
Output tab
External Filter
Fast path
Stage tab
Input tab
Output tab
Filter
Specifying the filter
Input data columns
Supported Boolean expressions and operators
Order of association
String comparison
Fast path
Stage tab
Input tab
Partitioning and collecting data
Output tab
Funnel
Fast path
Stage tab
Link Ordering section
Input tab
Output tab
Mapping output
Generic
Fast path
Stage tab
Input tab
Output tab
Head
Fast path
Stage tab
Input tab
Output tab
Hierarchical data
Using the Hierarchical Data stage
Adding a Hierarchical Data stage to a DataStage flow
Configuring runtime properties for the Hierarchical Data stage
The assembly
Input step
Output step
Assembly Editor
Opening the Assembly Editor
Mapping data
Working with the mapping table
Determining mapping candidates
Configuring how mapping candidates are determined
XML Composer step
XML Composer validation rules
XML Parser step
XML Parser validation rules
Setting default values for types
JSON transformation
Schema management
Opening the Schema Library Manager
Working with libraries and resources
Creating a JSON schema in the schema library
JSON Parser step
JSON Parser validation rules
JSON Composer step
JSON Composer validation rules
REST web services in DataStage
REST step pages
General
Security
Request
Response
Mappings
Output schema of the REST step
Passing multiple rows from an XML or JSON file
Transformation steps for the Hierarchical Data stage
Aggregate step
H-Pivot step
HJoin step
Order Join step
Regroup step
Sort step
Union step
V-Pivot step
Join
Join versus lookup
Fast path
Stage tab
Input tab
Output tab
Lookup
Lookup versus Join
Fast path
Properties
Stage tab
Input tab
Output tab
Make Subrecord
Examples
Fast path
Stage tab
Properties section
Input section
Output section
Options section
Advanced section
Input tab
Partitioning and collecting data
Output tab
Make Vector
Examples
Example 1
Example 2
Fast path
Stage tab
Properties section
Options section
Advanced section
Input tab
Partitioning and collecting data
Output tab
Merge
Fast path
Stage tab
Input tab
Output tab
Modify
Fast path
Stage tab
Input tab
Output tab
Peek
Fast path
Stage tab
Input tab
Output tab
Pivot Enterprise
Specifying a horizontal pivot operation
Specifying a horizontal pivot operation and mapping output columns
Example of horizontally pivoting data
Specifying a vertical pivot operation
Specifying a vertical pivot operation and mapping output columns
Example of vertically pivoting data
Properties tab
Specifying execution options
Specifying where the stage runs
Specifying partitioning or collecting methods
Specifying a sort operation
Promote Subrecord
Examples
Example 1
Example 2
Fast path
Stage tab
Properties tab
Options section
Advanced tab
Input tab
Partitioning and collecting data
Output tab
Remove Duplicates
Fast path
Stage tab
Input tab
Output tab
Row Generator
Fast path
Stage tab
Output tab
Sample
Fast path
Stage tab
Link Ordering
Input tab
Partitioning and collecting data
Output tab
Mapping
Sort
Fast path
Stage tab
Input tab
Output tab
Split Subrecord
Examples
Fast path
Stage tab
Properties tab
Options section
Advanced tab
Input tab
Partitioning and collecting data
Output tab
Split Vector
Examples
Example 1
Example 2
Fast path
Stage tab
Properties tab
Options section
Advanced tab
Input tab
Partitioning and collecting data
Output tab
Surrogate Key Generator
Creating the key source
Deleting the key source
Updating the state file
Generating surrogate keys
Switch
Example
Fast path
Stage tab
Input tab
Output tab
Tail
Fast path
Stage tab
Input tab
Output tab
Transformer
Basic concepts
Properties
Stage variables
Loop variables
Entering expressions
Loop example: converting a single row to multiple rows
Loop example: multiple repeating values in a single field
Loop example: generating new rows
Loop example: aggregating data
Surrogate Key tab
Link ordering
Advanced
Input tab
Output tab
Runtime column propagation
System variables
Evaluation sequences for transformer expressions, stage variables, and loop variables
Reserved words
Parallel transform functions
Date and time functions
Logical functions
Mathematical functions
Null handling functions
Number functions
Raw functions
String functions
Vector function
Type conversion functions
Utility functions
Wave Generator
Stage Tab
Properties
Input tab
Output tab
Write Range Map
Fast path
Stage tab
Input tab
QualityStage stages
Investigate
Stage tab
Input tab
Output tab
Match Frequency
One-source Match
Inputs to the One-source Match stage
One-source Match stage workflow
Creating One-source Match stage jobs
Configuring the One-source Match stage
Match types for the One-source Match stage
Match outputs for the One-source Match stage
Standardize
Fast path
Partitioning and collecting data
SQL Properties
Using stored procedures
Sharing DataStage artifacts with all IBM Cloud Object Storage containers
High availability and disaster recovery
DataStage command-line tools
Virtualizing data
Connecting to data sources
Supported data sources
Connecting to Amazon S3
Connecting to Ceph
Connecting to Cloud Object Storage
Connecting to Google BigQuery
Connecting to Snowflake
Status of data sources
Creating virtual objects
Creating a virtualized table from a single data source
Creating a virtualized table from multiple data sources
Creating a virtualized table from files in Cloud Object Storage
Creating schemas for virtual objects
Joining virtual objects
Managing access to virtual objects
Managing access to virtual objects for user roles
Revoking access to virtual objects for user roles
Managing visibility of virtual objects
Monitoring data access
Governing virtual data
Publishing virtual data to the catalog
Virtualizing data with business terms
Enabling strict mode
Enforcing business terms to virtualize data
Governing virtual data with data protection rules
Enabling enforcement of data protection rules
Masking virtual data
Managing caches and queries
Adding data caches
Cache recommendations
Configuring cache recommendations
Finding cache recommendations
Viewing query history
Restrictions for caching
Improving query performance
Collecting statistics
Enabling caching
Monitoring and exploring the service
Monitoring integrated databases
Exploring integrated databases
Administering users and roles
Connecting to the service
Managing roles for users
Assigning roles to users
Modifying user roles
Scaling the service
Scaling your service
SQL interface
Running SQL
Watson Query procedures
removeCosConn stored procedure
removeRdbcX stored procedure
setCosConn stored procedure
setRdbcX stored procedure
setRdbcX stored procedure
Watson Query views
LISTNODES view
LISTRDBC view
Limitations and known issues
データの分析とモデルの作成
ノートブック
ノートブックの作成
ノートブックの各部分
Jupyter およびノートブック環境
ライブラリーおよびスクリプト
カスタム・ライブラリーのインストール
地理時空間ライブラリー
データ・スキップ・ライブラリー
データ・スキップ構成オプション
Parquet 暗号化
アプリケーションによる鍵の管理
KMS による鍵の管理
時系列ライブラリー
時系列ライブラリーの使用
時系列の主要機能
時系列関数
時系列の遅延評価
時間参照システム
ノートブックへのスクリプトのインポート
ノートブックのコーディングおよび実行
ノートブック内のデータのロードおよびアクセス
データ・ロードのサポート
AWS S3 バケット内のデータへのアクセス
プロジェクト・トークンの手動追加
Python 用の project-lib の使用
Python 関数を使用した Cloud Object Storage の処理
R 用の project-lib の使用
ノートブックのスケジュール
SPSS 予測分析アルゴリズム
データの準備
分類および回帰
クラスタリング
予測
生存分析
スコア
ノートブックの共有および公開
ノートブックの共有
ノートブック内のコードの非表示
GitHub でのノートブックの公開
Gist としてのノートブックの公開
RStudio
RStudio での Spark の使用
Cognos Dashboards
Visual Recognition モデル
Core ML を使用したイメージの分類
セットアップ
カスタム・イメージ分類モデル
イメージの準備
トレーニング
テスト
リトレーニング
新しいサービス・インスタンスへの移動
カスタム・オブジェクト検出モデル
オブジェクト検出用のイメージの準備
オブジェクト検出のトレーニング
オブジェクト検出のテスト
組み込みモデル
アプリケーションの開発
サンプル・イメージ
Natural Language Classification
分類器の作成
トレーニング・データの準備
トレーニング
テスト
リトレーニング
ノートブック
アプリケーションの開発
AutoAI
AutoAI のチュートリアル
1 つのデータ・ソースを使用したエクスペリメントの構築
サンプル・データからのエクスペリメントの構築 (ベータ)
結合データを使用したエクスペリメントの構築 (ベータ)
チュートリアル: データ結合モデルの構築およびデプロイ (ベータ)
チュートリアル: マルチクラス・データ結合モデルの構築 (ベータ)
結合の特徴量エンジニアリングの詳細 (ベータ)
AutoAI で生成されたノートブックの保存
Python 用の autoai-lib の使用
AutoAI モデルの選択
AutoAI 実装の詳細
AutoAI エクスペリメントのトラブルシューティング
Federated Learning (ベータ版)
統合学習のチュートリアルとサンプル (ベータ版)
統合学習のチュートリアル (ベータ)
統合学習のサンプル (ベータ)
統合学習エクスペリメントの作成 (ベータ)
フレームワーク、融合方式、およびハイパーパラメーターの選択 (ベータ)
実装の追加の詳細 (ベータ)
ディープ・ラーニング・エクスペリメント
トレーニング実行
モデル定義
例
コーディング・ガイドライン
サード・パーティー・ライブラリー
ディープ・ラーニング・エクスペリメントの実行
ディープ・ラーニング Experiment Builder
GPU の使用
ハイパーパラメーターの最適化
分散トレーニング
分散ディープ・ラーニング
チュートリアル
Decision Optimization の作成およびデプロイ
Decision Optimization を使用する方法
サンプル・モデルとノートブック
Decision Optimization ノートブック
Decision Optimization モデル・ビルダー
モデル・ビルダーのビューとシナリオ
視覚化ビュー
Modeling Assistant モデル
Modeling Assistant での決定ドメインの選択
モデルの設計と実行: 住宅建設スケジューリング
Python DOcplex モデル
入出力データ
モデルの解決および分析: 規定食の問題
新規シナリオの作成
複数のシナリオの操作
複数のシナリオの生成
OPL モデル
実行パラメーター
SPSS Modeler
SPSS Modeler でサポートされるデータ・ソース
ノード・パレット
インポート
データ資産ノード
ユーザー入力ノード
シミュレーション生成ノード
拡張のインポート・ノード
レコード設定
条件抽出ノード
サンプリング・ノード
ソート・ノード
バランス・ノード
重複レコード・ノード
レコード集計ノード
レコード結合ノード
レコード追加ノード
ストリーミング時系列分析ノード
SMOTE ノード
RFM 集計ノード
スペース・タイム・ボックス・ノード
拡張の変換ノード
CPLEX の最適化ノード
フィールド設定
データの自動準備ノード
データ型ノード
データ型の情報の表示と設定
尺度
地理空間のサブ尺度
連続型データの変換
インスタンス化とは ?
データ値
値のオプションの設定
連続型データの値とラベルの指定
名義型データと順序型データの値とラベルの指定
フラグ値の指定
コレクション・データの値の指定
地理空間データの値の指定
欠損値の定義
データ型の値の確認
フィールドの役割の設定
フィールド・フォーマット・オプションの設定
フィルター・ノード
フィールド作成ノード
置換ノード
データ分類ノード
データ分割ノード
RFM 分析ノード
アンサンブル・ノード
データ区分ノード
フラグ設定ノード
再構成ノード
行列入替ノード
フィールド順序ノード
時系列ノード
時間区分ノード
匿名化ノード
再投影ノード
グラフ作成
グラフ・ノード
散布図ノード
線グラフ・ノード
時系列グラフ・ノード
分布図ノード
ヒストグラム・ノード
集計棒グラフ・ノード
Web グラフ・ノード
評価ノード
モデリング
自動分類ノード
自動数値ノード
自動クラスタリング・ノード
TCM ノード
ベイズ・ノード
C5.0 ノード
C&R Tree ノード
CHAID ノード
QUEST ノード
Tree-AS ノード
Random Trees ノード
ランダム・フォレスト・ノード
ディシジョン・リスト・ノード
時系列ノード
一般化線型ノード
GLMM ノード
GLE ノード
線型ノード
Linear-AS ノード
線型回帰ノード
LSVM ノード
ロジスティック回帰ノード
ニューラル・ネット・ノード
KNN ノード
Cox ノード
因子分析ノード
SVM ノード
特徴量選択ノード
判別分析ノード
SLRM ノード
時空間予測 (STP) ノード
時空間予測 (STP) モデル・ナゲット
アソシエーション・ルール・ノード
Apriori ノード
CARMA ノード
シーケンス・ノード
Kohonen ノード
異常値ノード
K-Means ノード
TwoStep クラスター・ノード
TwoStep-AS クラスター・ノード
Isotonic-AS ノード
XGBoost-AS ノード
K-Means-AS ノード
XGBoost ツリー・ノード
XGBoost Linear ノード
ガウス混合ノード
KDE ノード
One-Class SVM ノード
MultiLayerPerceptron-AS ノード
HDBSCAN ノード
拡張モデル・ノード
拡張モデル・ナゲット
Text Analytics
テキスト マイニングについて
抽出の方法
カテゴリー化の方法
言語識別子ノード
テキスト・リンク分析ノード
エキスパート・オプション
TLA ノード出力
テキスト・マイニング・ノード
テキスト・マイニング・モデル・ナゲット
インタラクティブ・ワークベンチ・モード
「カテゴリーとコンセプト」ビュー
クラスター・ビュー
テキスト リンク分析ビュー
リソース・エディター・ビュー
オプションの設定
言語学的手法の詳細設定
高度な頻度設定
モデル・ナゲットの生成
出力
テーブル・ノード
クロス集計ノード
精度分析ノード
データ検査ノード
変換ノード
記述統計ノード
平均値ノード
レポート・ノード
グローバルの設定ノード
シミュレーションの当てはめノード
KDE シミュレーション・ノード
拡張の出力ノード
エクスポート
データ資産エクスポート・ノード
拡張のエクスポート・ノード
拡張ノード
R スクリプト
Python for Spark スクリプト
Python for Spark を使用したスクリプト
データのメタデータ
日付、時刻、タイム スタンプ
例外
例
データの操作
データの欠損値
欠損値の処理
値が欠落しているレコードの処理
値が欠落しているフィールドの処理
システム値が欠落しているレコードの処理
欠損値に対して使用できる関数
コメントと注釈の追加
モデルのデプロイ
SQL 最適化
SQL プッシュバックの仕組み
SQL プッシュバックのパフォーマンスを最大化するためのヒント
SQL プッシュバックがサポートされているノード
SQL プッシュバックで使用できる CLEM 式と演算子
モデル・ナゲットから SQL を生成する
フロー内でノードを無効にする、またはフロー内でノードをキャッシュする
フロー内でノードを無効にする
ノードのキャッシュ・オプション
SPSS Modeler ストリームのインポート
フロー・プロパティーの設定
式ビルダー
関数の選択
SPSS アルゴリズム
モデルのデプロイと管理
Watson Machine Learning
Machine Learning の概要
サポートされるフレームワーク
モデル・タイプと構成の指定
Python クライアント
資産のマイグレーション
API および Python クライアントの変更
Python 関数のマイグレーション
用語
セットアップ
認証
サービス資格情報
サービス・インスタンスの作成
デフォルト・エンドポイントの変更
カスタム・コンポーネント
scikit-learn
TensorFlow
Tensorflow を使用したカスタム・レイヤー・モデルの永続化
デプロイメントの例とチュートリアル
AutoAI のチュートリアル
Machine Learning Python のサンプルと例
REST API のサンプルおよび例
機械学習モデルの作成
モデルのインポート
PMML
Spark MLlib
scikit-learn
XGBoost
TensorFlow
Keras
資産のデプロイ
デプロイメント・スペース
デプロイメント・スペース・ダッシュボード
スペースへのデータの追加
スペースに対するコラボレーターの権限
スペースからのデプロイ
オンライン・デプロイメントの作成
バッチ・デプロイメントの作成
バッチ・デプロイメントの詳細
複数の入力を使用した SPSS モデルのデプロイ
デプロイメント・ジョブの管理
Core ML デプロイメントの作成
Python クライアントを使用したモデルのデプロイ
Python 関数のデプロイ
デプロイ済み資産の管理
デプロイメント・エンドポイント URL の取得
デプロイメントの更新
デプロイメントのスケーリング
デプロイメントの削除
モデル管理
ModelOps を使用した AI ライフサイクルの管理
Decision Optimization
ユーザー・インターフェースを使用したモデルのデプロイ
デプロイメントのステップ
モデル・デプロイメント
モデルの実行
モデルの入出力データ・ファイルのフォーマット
モデルの入出力データの適応
出力データの定義
解決パラメーター
ジョブの実行
REST API の例
Python クライアントの例
マイグレーション
Watson Machine Learning API V4 ベータからのマイグレーション
Machine Learning-v2 インスタンスを使用した Decision Optimization の Python コードのマイグレーション
Decision Optimization on Cloud (DOcplexcloud) からのマイグレーション
Watson OpenScale
対話式セットアップのチュートリアル
Watson OpenScale をセットアップするための Python モジュールのインストール
Python SDK アドバンスト・チュートリアル
Python SDK V1 から V2 へのノートブックの更新
API、SDK、およびチュートリアル
サポートされる機械学習エンジン、フレームワーク、およびモデル
IBM Watson Machine Learning
Microsoft Azure ML Studio フレームワーク
Microsoft Azure ML Service フレームワーク
Amazon SageMaker フレームワーク
カスタム ML フレームワーク
サード・パーティーの ML エンジンと Watson OpenScale の統合
Watson OpenScale の構成
Watson OpenScale の資格情報の作成
モニターするデプロイメントの選択
データベースの指定
IBM Watson Machine Learning サービス以外のインスタンスのペイロード・ロギング
評価要求の送信
ペイロードとフィードバックのロギング
ペイロード・ロギングの自動化
バイアス緩和の処理の流れについて
間接バイアス
JSON 構成ファイルを使用したアセットのデプロイメントの構成
フィードバック・データのフォーマット設定とアップロード
訓練データのフォーマット設定とアップロード
Python クライアントまたは REST API を使用した入出力スキーマの定義
ライト・プランから有料プランへの Watson OpenScale のアップグレード
Watson OpenScale サービス・インスタンスおよびデータの削除
アラートのセットアップ
モニタリングのためのモデルの準備
モデル性能モニタリングの構成
公平性モニターの構成
説明性モニターの構成
ドリフト検出モニターの構成
エンドポイント・モニターの構成
非構造化テキスト・モデルの処理
カスタム・モニターとカスタム指標の作成
モデル・リスク管理とモデル・ガバナンスの構成
モデル・リスク管理のための Watson OpenScale の構成
IBM OpenPages MRG を使用したモデル・ガバナンスの構成
モデルのインサイトの取得
デプロイメントのデータの表示
特定の時間のデータの視覚化
バイアス緩和のオプション
トランザクションの説明
モデル・リスク管理とモデル・ガバナンス
モデル・リスクの管理
モデル・ガバナンス
公平性指標の概要
グループに関する公平性
品質指標の概要
混同行列
ROC 曲線下面積
PR 曲線下面積
正解率
真陽性率 (TPR)
偽陽性率 (FPR)
再現率
精度
F1 値
対数損失
分散説明率
平均絶対誤差
平均二乗誤差
R 2 乗
平均平方二乗誤差
加重真陽性率
加重偽陽性率
加重再現率
加重適合率
加重 F1 値
ドリフト検出
正確度のドリフト
データのドリフト
パフォーマンス指標の概要
スループット
評価ペイロードの分析
確信度別予測結果
グラフ・ビルダー
既知の問題と制約
高可用性と災害復旧
機密保護
Watson OpenScale Identity and Access Management
Watson OpenScale への接続の保護
Watson OpenScale でのデータの保護
カタログ
カタログの管理
プラットフォーム資産カタログの作成
カタログの作成
カタログへのアクセスの管理
カタログ・コラボレーターの権限
カタログ設定の変更
カタログの削除
カタログ資産
カタログ内の資産の検索と表示
カタログへの資産の追加
ファイルの追加
接続の追加
接続からのデータの追加
接続からのフォルダー資産の追加
プロジェクトからの資産の公開
COBOL コピーブック資産の追加
データ資産のダウンロード
資産プロパティーの編集
資産関係の追加
資産へのアクセスの制御
資産のプロファイル作成
データ品質スコア
データ品質ディメンション
資産の削除
ガバナンス成果物 (新規)
ガバナンスの準備
ガバナンス成果物の検索と表示
タグ
ガバナンス成果物の管理
ガバナンス成果物のインポート
カテゴリー
カテゴリーの管理
カテゴリー・コラボレーターの管理
カテゴリー・コラボレーター役割
カテゴリーのインポートまたはエクスポート
ポリシー
ポリシーの管理
ポリシーの作成
ガバナンス・ルール
ガバナンス・ルールの管理
ガバナンス・ルールの作成
データ保護ルール
データ保護ルールの評価
データ保護ルールの管理
マスキングに関する考慮事項
データのマスキング
ビジネス用語
ビジネス用語の管理
ビジネス用語の作成
分類
分類の管理
分類の作成
事前定義の分類
データ・クラス
データ・クラスの管理
マッチング・データ
事前定義されたデータ・クラス
事前定義されたデータ・クラスの詳細
参照データ
参照データ・セットの作成
参照データ・セットのファイルのインポート
参照データ・セット間の関係
ガバナンス成果物 (レガシー)
新規バージョンのガバナンス成果物へのアップグレード
データ保護のシナリオ例
資産へのアクセスの制限
ポリシーを使用したアクセスの制限
一部のユーザーのみの許可
他のユーザーに対して資産列のデータ値を非表示にする
カテゴリー
ポリシー
ポリシー評価
ポリシーの検索と表示
ポリシーの作成
ポリシーの管理
データ保護ルール
データ保護ルールの作成
マスキングに関する考慮事項
データのマスキング
システム用語
タグ
用語入力の例
ルールの表示または編集
ポリシー使用統計
ビジネス用語
ビジネス用語の検索と表示
ビジネス用語の作成
ビジネス用語の管理
ビジネス用語のインポート
データ分類
分類
データ・クラス
事前定義されたデータ・クラスの詳細
データ・クラス・グループ
トラブルシューティング
Watson Knowledge Catalog での 1 インスタンス制限
Data Refinery
Data Virtualization
Troubleshooting general issues
Cannot grant users access to a view
Troubleshooting virtualization issues
Speed up loading of tables when virtualizing
Reveal hidden tables when virtualizing
Listing of virtual objects is slow
Viewing of objects in your cart is slow
Troubleshooting governance issues
Access to a table is denied by policies
Cannot access assets in the catalog
Cannot access assets with masked data
Cannot enforce policies and data protection rules
Publishing data to the catalog fails
Troubleshooting data source connections
Cannot push down string functions with string units on Db2 remote data source
Snowflake connection times out
Cannot connect to data source
Cannot push down join views
Errors when you delete a connection
Troubleshooting queries
SQL messages
View related actions are not available
Error SQL0727N when you query view results
Error SQL1822N when you run a query
Concurrent queries are slow or fail
Incorrect query results for Db2 remote data sources
Data type String in Hive tables is assigned CLOB data type
Performance issues in queries with subqueries
SUM() or AVG() function returns an error
Table statistics are not collected
ディープ・ラーニング
Machine Learning
IBM Cloud の状況
IBM Cloud Object Storage
Watson OpenScale
管理
Cloud Pak for Data as a Service の管理
アカウントのリソース使用量のモニター
Watson Studio の許可ユーザーの管理
プロジェクトおよびカタログを作成するための Cloud Object Storage の構成
Watson Knowledge Catalog サービスの管理
アカウント設定の管理
サービス・プランのアップグレード
ハイブリッド・サブスクリプション・アドバンテージのアクティブ化
Cloud Pak for Data as a Service の使用の停止
設定の管理
役割の決定
IBM Cloud アカウントの管理
Activity Tracker のイベント
IAM 編集者役割の割り当て
Watson Studio Enterprise のセットアップ
Amazon EMR サービスの追加
用語集
Cloud Pak for Data as a Service
新機能
サービス・プランの変更と非推奨
2019 年の新機能
2018 年の新機能
2017 年の新機能
IBM Cloud Pak for Data as a Service の概要
サービス間の関係
Cloud Pak for Data の各デプロイメント間の比較
オファリング・プラン
機能マトリックス
既知の問題と制約
リージョンの制限事項
FAQ
サービス用の API
セキュリティー
データのセキュリティーおよび準拠性の保持
外部サイトへのアクセスの制限
サービス・エンドポイントでのサービスへの接続の保護
特記事項
アクセシビリティー
サービスと統合
IBM Cloud サービス
サービスの作成
Watson Studio
Watson Studio のオファリング・プラン
Watson Knowledge Catalog
Watson Knowledge Catalog のオファリング・プラン
Watson Machine Learning
Machine Learning のオファリング・プラン
Analytics Engine
Cloudant
Cloud Object Storage
Cognos Dashboard Embedded
Databases for EDB
Databases for MongoDB
Databases for PostgreSQL
DataStage (ベータ版)
Db2
Db2 Warehouse
Match 360 with Watson (ベータ版)
セキュア・ゲートウェイ
SQL 照会
Streaming Analytics
Visual Recognition
Watson Assistant
Watson Discovery
Watson Natural Language Understanding
Watson Language Translator
Watson Natural Language Classifier
Watson OpenScale
Watson Personality Insights
Watson Speech to Text
Watson Text to Speech
Watson Tone Analyzer
その他のクラウド・プラットフォームとの統合
AWS との統合
Azure との統合
Google との統合
Satellite ロケーション
始めに
ビデオ
個人アカウントの登録
組織のアカウントへの参加
組織のアカウントのセットアップ
ユーザーの役割と権限
エンドツーエンドの例: 業界アクセラレーター
資産タイプとプロパティー
プロファイル
プレビュー
アクティビティー
資産の検索
ツールの選択
ロール
追加リソース
プロジェクト
プロジェクトの作成
オブジェクト・ストレージ
プロジェクトのインポート
プロジェクトの管理
コラボレーターの管理
プロジェクト・コラボレーター役割
関連付けられているサービスの追加
プロジェクトのエクスポート
プロジェクト内の資産の管理
環境
ノートブック環境
Spark 環境
Satellite ロケーションの環境
Data Refinery 環境
DataStage 環境 (技術プレビュー)
RStudio 環境
GPU 環境
環境の管理
環境の作成
環境のカスタマイズ
カスタマイズの例
アクティブ・ランタイムの停止
ランタイム使用量
ジョブ
プロジェクトへのカタログ資産の追加
プロジェクトからの離脱
マークダウンの虎の巻
データの準備
プロジェクトへのデータの追加
プロジェクトへの非常に大容量のファイルの追加
プロジェクトへの接続の追加
COS バケットへのアクセスの制御
接続からのデータの追加
接続からのフォルダー資産の追加
メタデータのインポート
接続タイプ
Amazon RDS for MySQL 接続
Amazon RDS for PostgreSQL 接続
Apache Cassandra 接続
Box 接続
Elasticsearch 接続
HTTP 接続
IBM Cloud Object Storage 接続
IBM Cloud Object Storage (インフラストラクチャー) 接続
IBM Cognos Analytics 接続
IBM Data Virtualization Manager for z/OS 接続
IBM Db2 接続
IBM Db2 Event Store 接続
IBM Planning Analytics 接続
MariaDB 接続
Microsoft Azure Blob Storage 接続
Microsoft Azure Cosmos DB 接続
Microsoft Azure Data Lake Store 接続
Microsoft Azure File Storage 接続
MongoDB 接続
MySQL 接続
OData 接続
Oracle 接続
PostgreSQL 接続
Salesforce.com 接続
SAP OData 接続
Snowflake 接続
プラットフォーム接続の追加
データ資産のダウンロード
データの精製
Data Refinery へのデータの追加
データのフォーマットの指定
データの検証
データの視覚化
Data Refinery フローの管理
ソースからターゲットへのデータのコピー
GUI 操作
対話式コード・テンプレート
チュートリアル: 生データのシェーピング
データ・アノテーション
Figure Eight によるデータの注釈付け
DefinedCrowd によるデータの注釈付け
マスター・データの管理 (ベータ)
「始めに」チュートリアル
IBM Match 360 with Watson に対するアクセス権限のユーザーへの付与
マスター・データの構成
データ・モデルのカスタマイズ
データの追加およびデータ・モデルへのマッピング
マスター・データ・エンティティーを作成するためのデータのマッチング
IBM Match 360 with Watson ジョブの管理
マッチング・アルゴリズムのカスタマイズと強化
マスター・データの探索
レコードおよび属性の表示方法の定義
マスター・データ・エンティティーおよびレコードの探索
個々のレコードの追加および編集
マスター・データのエクスポート
IBM Match 360 with Watson API の概要
DataStage
Adding data to IBM DataStage
Creating a DataStage flow
Downloading and importing a DataStage flow and its dependencies
DataStage connectors
Asset browser
Data set
File set
Input tab
Output tab
Lookup file set
Sequential file
Defining data definitions
Making parts of your job design reusable
Local subflows
Subflows
Making jobs adaptable
Creating and using parameters and parameter sets
Inserting parameters and parameter sets as properties
Migrating DataStage jobs
DataStage stages
Aggregator
Fast path
Stage tab
Calculation and recalculation dependent properties
Input tab
Output tab
Bloom Filter
Stage tab
Input tab
Output tab
Change Apply
Example data
Fast path
Change Capture
Fast path
Stage tab
Input tab
Output tab
Checksum
Adding a Checksum column to your data
Properties for Checksum Stage
Mapping output columns
Specifying execution options
Column Export
Fast path
Stage tab
Input tab
Format section
Output tab
Column Generator
Fast path
Stage tab
Input tab
Output tab
Column Import
Examples
Fast path
Stage tab
Input tab
Output tab
Output link format section
Combine Records
Examples
Example 1
Example 2
Fast path
Stage tab
Properties section
Outputs section
Combine keys section
Options section
Advanced section
NLS Locale section
Input tab
Partitioning and collecting data
Output tab
Compare
Fast path
Stage tab
Input tab
Output tab
Compress
Fast path
Stage tab
Input tab
Output tab
Copy
Fast path
Stage tab
Input tab
Output tab
Decode
Fast path
Input tab
Output tab
Difference
Fast path
Stage tab
Input tab
Output tab
Encode
Fast path
Stage tab
Input tab
Output tab
Expand
Fast path
Stage tab
Input tab
Partitioning and collecting data
Output tab
External Filter
Fast path
Stage tab
Input tab
Output tab
Filter
Specifying the filter
Input data columns
Supported Boolean expressions and operators
Order of association
String comparison
Fast path
Stage tab
Input tab
Partitioning and collecting data
Output tab
Funnel
Fast path
Stage tab
Link Ordering section
Input tab
Output tab
Mapping output
Generic
Fast path
Stage tab
Input tab
Output tab
Head
Fast path
Stage tab
Input tab
Output tab
Hierarchical data
Using the Hierarchical Data stage
Adding a Hierarchical Data stage to a DataStage flow
Configuring runtime properties for the Hierarchical Data stage
The assembly
Input step
Output step
Assembly Editor
Opening the Assembly Editor
Mapping data
Working with the mapping table
Determining mapping candidates
Configuring how mapping candidates are determined
XML Composer step
XML Composer validation rules
XML Parser step
XML Parser validation rules
Setting default values for types
JSON transformation
Schema management
Opening the Schema Library Manager
Working with libraries and resources
Creating a JSON schema in the schema library
JSON Parser step
JSON Parser validation rules
JSON Composer step
JSON Composer validation rules
REST web services in DataStage
REST step pages
General
Security
Request
Response
Mappings
Output schema of the REST step
Passing multiple rows from an XML or JSON file
Transformation steps for the Hierarchical Data stage
Aggregate step
H-Pivot step
HJoin step
Order Join step
Regroup step
Sort step
Union step
V-Pivot step
Join
Join versus lookup
Fast path
Stage tab
Input tab
Output tab
Lookup
Lookup versus Join
Fast path
Properties
Stage tab
Input tab
Output tab
Make Subrecord
Examples
Fast path
Stage tab
Properties section
Input section
Output section
Options section
Advanced section
Input tab
Partitioning and collecting data
Output tab
Make Vector
Examples
Example 1
Example 2
Fast path
Stage tab
Properties section
Options section
Advanced section
Input tab
Partitioning and collecting data
Output tab
Merge
Fast path
Stage tab
Input tab
Output tab
Modify
Fast path
Stage tab
Input tab
Output tab
Peek
Fast path
Stage tab
Input tab
Output tab
Pivot Enterprise
Specifying a horizontal pivot operation
Specifying a horizontal pivot operation and mapping output columns
Example of horizontally pivoting data
Specifying a vertical pivot operation
Specifying a vertical pivot operation and mapping output columns
Example of vertically pivoting data
Properties tab
Specifying execution options
Specifying where the stage runs
Specifying partitioning or collecting methods
Specifying a sort operation
Promote Subrecord
Examples
Example 1
Example 2
Fast path
Stage tab
Properties tab
Options section
Advanced tab
Input tab
Partitioning and collecting data
Output tab
Remove Duplicates
Fast path
Stage tab
Input tab
Output tab
Row Generator
Fast path
Stage tab
Output tab
Sample
Fast path
Stage tab
Link Ordering
Input tab
Partitioning and collecting data
Output tab
Mapping
Sort
Fast path
Stage tab
Input tab
Output tab
Split Subrecord
Examples
Fast path
Stage tab
Properties tab
Options section
Advanced tab
Input tab
Partitioning and collecting data
Output tab
Split Vector
Examples
Example 1
Example 2
Fast path
Stage tab
Properties tab
Options section
Advanced tab
Input tab
Partitioning and collecting data
Output tab
Surrogate Key Generator
Creating the key source
Deleting the key source
Updating the state file
Generating surrogate keys
Switch
Example
Fast path
Stage tab
Input tab
Output tab
Tail
Fast path
Stage tab
Input tab
Output tab
Transformer
Basic concepts
Properties
Stage variables
Loop variables
Entering expressions
Loop example: converting a single row to multiple rows
Loop example: multiple repeating values in a single field
Loop example: generating new rows
Loop example: aggregating data
Surrogate Key tab
Link ordering
Advanced
Input tab
Output tab
Runtime column propagation
System variables
Evaluation sequences for transformer expressions, stage variables, and loop variables
Reserved words
Parallel transform functions
Date and time functions
Logical functions
Mathematical functions
Null handling functions
Number functions
Raw functions
String functions
Vector function
Type conversion functions
Utility functions
Wave Generator
Stage Tab
Properties
Input tab
Output tab
Write Range Map
Fast path
Stage tab
Input tab
QualityStage stages
Investigate
Stage tab
Input tab
Output tab
Match Frequency
One-source Match
Inputs to the One-source Match stage
One-source Match stage workflow
Creating One-source Match stage jobs
Configuring the One-source Match stage
Match types for the One-source Match stage
Match outputs for the One-source Match stage
Standardize
Fast path
Partitioning and collecting data
SQL Properties
Using stored procedures
Sharing DataStage artifacts with all IBM Cloud Object Storage containers
High availability and disaster recovery
DataStage command-line tools
Virtualizing data
Connecting to data sources
Supported data sources
Connecting to Amazon S3
Connecting to Ceph
Connecting to Cloud Object Storage
Connecting to Google BigQuery
Connecting to Snowflake
Status of data sources
Creating virtual objects