0 / 0
資料の 英語版 に戻る
Apache HDFS 接続
Apache HDFS 接続

Apache HDFS 接続

Apache HDFS 内のデータにアクセスするには、そのデータ用の接続資産を作成します。

Apache Hadoop Distributed File System (HDFS) は、コモディティー・ハードウェア上で実行するように設計された分散ファイル・システムです。 Apache HDFS は、以前は Hortonworks HDFS でした。

Apache HDFS への接続の作成

接続資産を作成するには、以下の接続の詳細が必要です。 WebHDFS URL は必須です。

  • HDFSにアクセスするための WebHDFS URL。
  • Hive HTTP パス: サーバーが HTTP トランスポート・モード用に構成されている場合のエンドポイントのパス (例: gateway/default/hive)。
  • Hive ホスト: Apache Hive サーバーのホスト名または IP アドレス。
  • Hive のポート番号: Apache Hive サーバーのポート番号です。 デフォルト値は 10000 です。
  • Hive データベース: Apache Hive内のデータベースです。
  • SSL 証明書 ( Apache Hive サーバーで必要な場合)。

資格情報

ユーザー名は必須です。

  • ユーザー名とパスワード
  • Apache Hive に接続するための Hive ユーザーとパスワード

プライベート接続の場合、インターネットに外部化されていないデータベース (例えば、ファイアウォールの内側) に接続するには、 セキュア接続をセットアップする必要があります。

プラットフォーム内の場所に基づいて接続を作成する方法を選択してください

プロジェクト内 「資産」>「新規資産」>「データ・アクセス・ツール」>「接続」をクリックします。 プロジェクトへの接続の追加を参照してください。


カタログ内 「カタログに追加」>「接続」をクリックします。 カタログへの接続資産の追加を参照してください。


デプロイメント・スペース内 「スペースに追加」>「接続」をクリックします。 デプロイメント・スペースへの接続の追加を参照してください。


Platform assets catalog 新規接続」をクリックします。 プラットフォーム接続の追加を参照してください。

次のステップ: 接続からデータ資産を追加する

この接続を使用できる場所

Apache HDFS 接続は、以下のワークスペースおよびツールで使用できます:

プロジェクト

  • Data Refinery (Watson Studio または Watson Knowledge Catalog)
  • DataStage (DataStage)
  • Metadata import (Watson Knowledge Catalog)
  • SPSS Modeler (Watson Studio)

カタログ

  • Platform assets catalog
  • 他のカタログ (Watson Knowledge Catalog)

Apache HDFS のセットアップ

Hadoop クラスターのインストールとセットアップ

サポートされるファイル・タイプ

Apache HDFS 接続は、Avro、CSV、Delimited text、Excel、JSON、ORC、Parquet、SAS、SAV、SHP、および XML の各ファイル・タイプをサポートします。

もっと見る

Apache HDFS ユーザーズ・ガイド

親トピック: サポートされた接続