Microsoft Azure Data Lake Storageでデータにアクセスするには、その接続資産を作成します。
Azure Data Lake Storage (ADLS) は、Microsoft のパブリック・クラウドである Azureでホストされるスケーラブルなデータ・ストレージおよび分析サービスです。 Microsoft Azure Data Lake Storage 接続は、 Gen1 リポジトリーと Gen2 Azure Data Lake Storage リポジトリーの両方へのアクセスをサポートします。
Microsoft Azure Data Lake Storage への接続の作成
接続資産を作成するには、以下の接続の詳細が必要です:
Microsoft Entra IDは、クラウドベースのIDおよびアクセス管理サービスである。 Entra ID 認証方式の接続値を取得するには、Microsoft Azure ポータルにサインインして、ストレージアカウントに移動します。 Microsoft Entra IDについては、MicrosoftのEntra IDとはを参照してください。
Entra ID クライアント秘密鍵資格情報
- Tenant ID: Microsoft Entra のテナント ID。 テナントIDを見つけるには、Microsoft Entra ID> プロパティにアクセスしてください。 テナントIDフィールドまでスクロールダウンします。 詳細については、MicrosoftのEntraテナントIDの見つけ方を参照してください。
- Client ID: Microsoft Azure Data Lake Storageへのアクセスを認可するためのクライアントID。 アプリケーションのクライアント ID を検索するには、Microsoft Entra ID を選択します。 アプリケーション登録から、アプリケーションを選択します。 アプリケーションのクライアントIDをコピーするには、コピーをクリックします。 詳細は、Microsoft Entra アプリの登録とサービスプリンシパルの作成を参照してください。
- クライアントシークレット: Microsoft Azure Data Lake Storageへのアクセスを認証するためのクライアントIDに関連付けられた認証キー。 アプリケーションのクライアントシークレットを見つけるには、Microsoft Entra ID を選択します。 アプリケーション登録から、アプリケーションを選択します。 Certificates & secrets > Client secrets にアクセスしてください。 既存のクライアントシークレットをコピーするには、コピーをクリックし、新しいクライアントシークレットを作成してコピーするには、新しいクライアントシークレットをクリックします。 詳細は、Microsoft Entra アプリの登録とサービスプリンシパルの作成を参照してください。
- ストレージアカウントのURL: ストレージアカウントのURL。
Entra ID ユーザー名パスワード資格情報
- クライアントID: Microsoft Azure Data Lake Storageへのアクセスを承認するためのクライアントID。 アプリケーションのクライアント ID を検索するには、Microsoft Entra ID を選択します。 アプリケーション登録から、アプリケーションを選択します。 アプリケーションのクライアントIDをコピーするには、コピーをクリックします。 詳細は、Microsoft Entra アプリの登録とサービスプリンシパルの作成を参照してください。
- ユーザー名とパスワードです:Microsoft Azure Data Lake Storageアカウントのユーザー名とパスワード。 多要素認証なしでファイルにアクセスするには権限が必要です。
- ストレージアカウントのURL: ストレージアカウントのURL。
- WebHDFS URL: HDFS にアクセスするための WebHDFS URL。
第 2 世代 ADLS に接続するには、https://<account-name>.dfs.core.windows.net/<file-system>
という形式を使用します。ここで、<account-name>
は、ADLS インスタンスの作成時に使用した名前です。
<file-system>
の場合は、作成したコンテナーの名前を使用します。 詳細については、Microsoft Data Lake StorageGen2のドキュメントを参照のこと。
' - Tenant ID: The Azure Active Directory tenant ID
- クライアント ID: Microsoft Azure Data Lake Storage へのアクセスを許可するためのクライアント ID
- クライアント秘密鍵: Microsoft Azure Data Lake Storage へのアクセスを許可するためのクライアント ID に関連付けられている認証鍵
プロキシー・サーバーを介して Azure Data Lake Storage データ・ソースにアクセスするには、 「サーバー・プロキシー」 を選択します。 プロキシー・サーバーは、そのセットアップに応じて、ロード・バランシング、強化されたセキュリティー、およびプライバシーを提供することができます。 プロキシー・サーバーの設定は、認証資格情報および個人資格情報または共有資格情報の選択に依存しません。
- プロキシー・ホスト: プロキシー URL。 例えば、
https://proxy.example.com
です。 - プロキシー・ポート番号: プロキシー・サーバーに接続するためのポート番号。 例えば、
8080
または8443
などです。 - HTTP または HTTPS の 「プロキシー・プロトコル」 の選択はオプションです。
プライベート接続の場合、インターネットに外部化されていないデータベース (例えば、ファイアウォールの内側) に接続するには、 セキュア接続をセットアップする必要があります。
プラットフォーム内の場所に基づいて接続を作成する方法を選択してください
- プロジェクト内
- 「アセット」>「新規アセット」>「データ・ソースへの接続」をクリックします。 プロジェクトへの接続の追加を参照してください。
- デプロイメント・スペース内
- 「アセットのインポート」>「データ・アクセス」>「接続」をクリックします。 デプロイメント・スペースへのデータ資産の追加を参照してください。
- Platform assets catalog
- 新規接続をクリックしてください。 プラットフォーム接続の追加を参照してください。
次のステップ: 接続からデータ資産を追加する
- プロジェクトでの接続からのデータの追加を参照してください。
この接続を使用できる場所
Microsoft Azure Data Lake Storage 接続は、以下のワークスペースおよびツールで使用できます。
プロジェクト
- Decision Optimization
- SPSS Modeler
- Synthetic Data Generator
カタログ
- Platform assets catalog
Azure Data Lake Storage 認証のセットアップ
認証をセットアップするには、テナント ID、クライアント (またはアプリケーション) ID、およびクライアント秘密鍵が必要です。
- Gen1:
- Azure Active Directory (Azure AD) Web アプリケーションを作成し、アプリケーション ID、認証鍵、およびテナント ID を取得します。
- 次に、 Azure AD アプリケーションを Azure Data Lake Storage のアカウント・ファイルまたはフォルダーに割り当てる必要があります。 Azure Active Directoryを使用したAzureData Lake StorageのService-to-Service認証のステップ1、2、3に従ってください。
- Gen2:
- クライアント アプリケーションからのリクエストを認証するためAzureAD からトークンを取得するに」の手順に従ってください。 これらのステップにより、新しい ID が作成されます。 ID を作成したら、ADLS へのアクセス権限をアプリケーションに付与するための権限を設定します。 Microsoft Azure Data Lake Storage 接続は、アプリケーションの関連付けられたクライアント ID、クライアント・シークレット、およびテナント ID を使用します。
- ストレージ・エクスプローラーを使用して、Azure アプリにストレージ・コンテナーへのアクセス権限を付与します。 手順については、 AzureStorage Explorer を使用しAzureData Lake StorageGen2のディレクトリとファイルを管理するを/span>てを参照してください。
サポートされるファイル・タイプ
Microsoft Azure Data Lake Storage 接続は、Avro、CSV、Delimited テキスト、Excel、JSON、ORC、Parquet、SAS、SAV、SHP、および XML の各ファイル・タイプをサポートします。
表形式
フラット・ファイルに加えて、 Microsoft Azure Data Lake Storage 接続では、データ・レイク・テーブル・フォーマットとしてデルタ・レイクおよび Iceberg がサポートされます。
詳細情報
親トピック: サポートされた接続