Apache HDFS 接続

資料の英語版に戻る

Apache HDFS 接続

Apache HDFS 内のデータにアクセスするには、そのデータ用の接続資産を作成します。

Apache Hadoop Distributed File System (HDFS) は、コモディティー・ハードウェア上で実行するように設計された分散ファイル・システムです。 Apache HDFS は、以前は Hortonworks HDFS でした。

Apache HDFS への接続の作成

接続資産を作成するには、以下の接続の詳細が必要です。 WebHDFS URL は必須です。
接続フォームで使用可能なプロパティーは、 「 Apache Hive を選択して Hive データ・ソースにテーブルを書き込むことができるかどうかによって異なります。

WebHDFS URL 。 HDFSにアクセスします。
Hive ホスト: Apache Hive サーバーのホスト名または IP アドレス。
Hive データベース: Apache Hive内のデータベースです。
Hive のポート番号: Apache Hive サーバーのポート番号です。デフォルト値は 10000です。
Hive HTTP パス: サーバーが HTTP トランスポート・モード用に構成されている場合のエンドポイントのパス (gateway/default/hive など)。
SSL 証明書 ( Apache Hive サーバーで必要な場合)。

ユーザー名は必須です。

プライベート接続の場合、インターネットに外部化されていないデータベース (例えば、ファイアウォールの内側) に接続するには、セキュア接続をセットアップする必要があります。

プロジェクト内: 「資産」>「新規資産」>「データ・アクセス・ツール」>「接続」をクリックします。プロジェクトへの接続の追加を参照してください。
カタログ内: 「カタログに追加」>「接続」をクリックしてください。カタログへの接続資産の追加を参照してください。
デプロイメント・スペース内: 「スペースに追加」>「接続」をクリックします。デプロイメント・スペースへの接続の追加を参照してください。
Platform assets catalog: 新規接続をクリックしてください。プラットフォーム接続の追加を参照してください。

Apache HDFS 接続は、以下のワークスペースおよびツールで使用できます：

プロジェクト

カタログ

Apache HDFS 接続は、Avro、CSV、Delimited text、Excel、JSON、ORC、Parquet、SAS、SAV、SHP、および XML の各ファイル・タイプをサポートします。

フラット・ファイルに加えて、 Apache HDFS 接続では、データ・レイク・テーブル・フォーマットとしてデルタ・レイクおよび Iceberg がサポートされています。

親トピック: サポートされた接続