Microsoft Azure Data Lake Storage 接続

最終更新: 2025年4月05日
Microsoft Azure Data Lake Storage 接続

Microsoft Azure Data Lake Storageでデータにアクセスするには、その接続資産を作成します。

Azure Data Lake Storage (ADLS) は、Microsoft のパブリック・クラウドである Azureでホストされるスケーラブルなデータ・ストレージおよび分析サービスです。 Microsoft Azure Data Lake Storage 接続は、 Gen1 リポジトリーと Gen2 Azure Data Lake Storage リポジトリーの両方へのアクセスをサポートします。

Microsoft Azure Data Lake Storage への接続の作成

接続資産を作成するには、以下の接続の詳細が必要です:

注: エントラID認証の前提条件:

Microsoft Entra IDは、クラウドベースのIDおよびアクセス管理サービスである。 Entra ID 認証方式の接続値を取得するには、Microsoft Azure ポータルにサインインして、ストレージアカウントに移動します。 Microsoft Entra IDについては、MicrosoftのEntra IDとはを参照してください。

Entra ID クライアント秘密鍵資格情報

  • Tenant ID: Microsoft Entra のテナント ID。 テナントIDを見つけるには、Microsoft Entra ID> プロパティにアクセスしてください。 テナントIDフィールドまでスクロールダウンします。 詳細については、MicrosoftのEntraテナントIDの見つけ方を参照してください。
  • Client ID: Microsoft Azure Data Lake Storageへのアクセスを認可するためのクライアントID。 アプリケーションのクライアント ID を検索するには、Microsoft Entra ID を選択します。 アプリケーション登録から、アプリケーションを選択します。 アプリケーションのクライアントIDをコピーするには、コピーをクリックします。 詳細は、Microsoft Entra アプリの登録とサービスプリンシパルの作成を参照してください。
  • クライアントシークレット: Microsoft Azure Data Lake Storageへのアクセスを認証するためのクライアントIDに関連付けられた認証キー。 アプリケーションのクライアントシークレットを見つけるには、Microsoft Entra ID を選択します。 アプリケーション登録から、アプリケーションを選択します。 Certificates & secrets > Client secrets にアクセスしてください。 既存のクライアントシークレットをコピーするには、コピーをクリックし、新しいクライアントシークレットを作成してコピーするには、新しいクライアントシークレットをクリックします。 詳細は、Microsoft Entra アプリの登録とサービスプリンシパルの作成を参照してください。
  • ストレージアカウント URL :ストレージアカウント URL。

Entra ID ユーザー名パスワード資格情報

  • クライアントID: Microsoft Azure Data Lake Storageへのアクセスを承認するためのクライアントID。 アプリケーションのクライアント ID を検索するには、Microsoft Entra ID を選択します。 アプリケーション登録から、アプリケーションを選択します。 アプリケーションのクライアントIDをコピーするには、コピーをクリックします。 詳細は、Microsoft Entra アプリの登録とサービスプリンシパルの作成を参照してください。
  • ユーザー名パスワードです:Microsoft Azure Data Lake Storageアカウントのユーザー名とパスワード。 多要素認証なしでファイルにアクセスするには権限が必要です。
  • ストレージアカウント URL :ストレージアカウント URL。
  • WebHDFS URL: HDFS にアクセスするための WebHDFS URL。
    第 2 世代 ADLS に接続するには、 https://<account-name>.dfs.core.windows.net/<file-system>
    という形式を使用します。ここで、 <account-name> は、ADLS インスタンスの作成時に使用した名前です。
    <file-system>の場合は、作成したコンテナーの名前を使用します。 詳細については 、Microsoft Data Lake Storage Gen2 のドキュメントを参照してください。

  • Tenant ID: The Azure Active Directory tenant ID
  • クライアント ID: Microsoft Azure Data Lake Storage へのアクセスを許可するためのクライアント ID
  • クライアント秘密鍵: Microsoft Azure Data Lake Storage へのアクセスを許可するためのクライアント ID に関連付けられている認証鍵

プロキシー・サーバーを介して Azure Data Lake Storage データ・ソースにアクセスするには、 「サーバー・プロキシー」 を選択します。 プロキシー・サーバーは、そのセットアップに応じて、ロード・バランシング、強化されたセキュリティー、およびプライバシーを提供することができます。 プロキシー・サーバーの設定は、認証資格情報および個人資格情報または共有資格情報の選択に依存しません。

  • プロキシホスト :プロキシ URL。 例えば、https://proxy.example.comです。
  • プロキシー・ポート番号: プロキシー・サーバーに接続するためのポート番号。 例えば、 8080 または 8443などです。
  • HTTP または HTTPS のプロキシプロトコルの選択は任意です。
  • プロキシなし :接続で設定されたプロキシをバイパスするホストのカンマ区切りリスト。

プライベート接続の場合、インターネットに外部化されていないデータベース (例えば、ファイアウォールの内側) に接続するには、 セキュア接続をセットアップする必要があります。

プラットフォーム内の場所に基づいて接続を作成する方法を選択してください

プロジェクト内
「アセット」>「新規アセット」>「データ・ソースへの接続」をクリックします。 プロジェクトへの接続の追加を参照してください。
カタログ内
「カタログに追加」>「接続」をクリックしてください。 カタログへの接続資産の追加を参照してください。
デプロイメント・スペース内
「アセットのインポート」>「データ・アクセス」>「接続」をクリックします。 デプロイメント・スペースへのデータ資産の追加を参照してください。
Platform assets catalog
新規接続をクリックしてください。 プラットフォーム接続の追加を参照してください。

次のステップ: 接続からデータ資産を追加する

Azure Data Lake Storage 認証のセットアップ

認証をセットアップするには、テナント ID、クライアント (またはアプリケーション) ID、およびクライアント秘密鍵が必要です。

サポートされるファイル・タイプ

Microsoft Azure Data Lake Storage 接続は、Avro、CSV、Delimited テキスト、Excel、JSON、ORC、Parquet、SAS、SAV、SHP、および XML の各ファイル・タイプをサポートします。

テーブル・フォーマット

フラットファイルに加え、 Microsoft Azure Data Lake Storage 接続は以下のデータレイクテーブル形式をサポートしています。 Delta Lake およびIceberg。

もっと見る

Azure データレイク

親トピック: サポートされた接続