Pour accéder à vos données dans Microsoft Azure Data Lake Storage, créez un actif de connexion pour ces données.
Azure Data Lake Storage (ADLS) est un service d'analyse et de stockage de données évolutif qui est hébergé dans Azure, le cloud public de Microsoft. La connexion Microsoft Azure Data Lake Storage prend en charge l'accès aux référentiels Gen1 et Gen2 Azure Data Lake Storage.
Créez une connexion à Microsoft Azure Data Lake Storage
Copy link to section
Pour créer l'actif de connexion, il vous faut ces informations de connexion :
Remarque :Conditions préalables à l'authentification Entra ID:
Microsoft Entra ID est un service de gestion des identités et des accès basé sur le cloud. Pour obtenir les valeurs de connexion pour la méthode d'authentification Entra ID, connectez-vous au portail Microsoft Azure et accédez à votre compte de stockage. Pour plus d'informations sur Microsoft Entra ID, voir Qu'est-ce que Microsoft Entra ID?.
Données d'identification secrètes du client de l'ID d'entrée
Tenant ID : l'identifiant du locataire Microsoft Entra. Pour trouver l'identifiant du locataire, allez dans Microsoft Entra ID> Properties. Descendez jusqu'au champ Tenant ID. Pour plus d'informations, voir Comment trouver votre identifiant de locataire Microsoft Entra.
Client ID : L'identifiant du client pour autoriser l'accès à Microsoft Azure Data Lake Storage. Pour trouver l'identifiant du client de votre application, sélectionnez Microsoft Entra ID. Dans Inscriptions d'applications, sélectionnez votre application. Cliquez sur Copier pour copier l'ID client de votre application. Pour plus d'informations, voir Enregistrer une application Microsoft Entra et créer un principal de service.
Client secret : la clé d'authentification associée à l'identifiant du client pour autoriser l'accès à Microsoft Azure Data Lake Storage. Pour trouver le secret client de votre application, sélectionnez Microsoft Entra ID. Dans Inscriptions d'applications, sélectionnez votre application. Allez dans Certificats & secrets > Client secrets. Cliquez sur Copier pour copier le secret client existant ou cliquez sur Nouveau secret client pour créer un nouveau secret client et le copier. Pour plus d'informations, voir Enregistrer une application Microsoft Entra et créer un principal de service.
Compte de stockage URL : Compte de stockage URL.
Données d'identification du mot de passe de l'ID Entra
Identifiant du client: L'identifiant du client pour autoriser l'accès à Microsoft Azure Data Lake Storage. Pour trouver l'identifiant du client de votre application, sélectionnez Microsoft Entra ID. Dans Inscriptions d'applications, sélectionnez votre application. Cliquez sur Copier pour copier l'ID client de votre application. Pour plus d'informations, voir Enregistrer une application Microsoft Entra et créer un principal de service.
Nom d'utilisateur et Mot de passe : Nom d'utilisateur et mot de passe du compte Microsoft Azure Data Lake Storage. Vous devez obtenir l'autorisation d'accéder au fichier sans authentification multifactorielle.
Compte de stockage URL : Compte de stockage URL.
URL WebHDFS : URL WebHDFS pour l'accès à HDFS. Pour vous connecter à un ADLS de génération 2, utilisez le format https://<account-name>.dfs.core.windows.net/<file-system> où <account-name> est le nom que vous avez utilisé lors de la création de l'instance ADLS. Pour <file-system>, utilisez le nom du conteneur que vous avez créé. Pour plus d'informations, consultez la documentation Microsoft Data Lake Storage Gen2.
ID locataire : l'ID du locataire Active Directory Azure
ID client: ID client permettant d'autoriser l'accès à Microsoft Azure Data Lake Storage
Secret client: clé d'authentification associée à l'ID client pour autoriser l'accès à Microsoft Azure Data Lake Storage
Sélectionnez Serveur proxy pour accéder à la source de données Azure Data Lake Storage via un serveur proxy. En fonction de sa configuration, un serveur proxy peut fournir un équilibrage de charge, une sécurité et une confidentialité accrues. Les paramètres du serveur proxy sont indépendants des données d'authentification et de la sélection des données d'identification personnelles ou partagées.
Hôte proxy : Le proxy URL. Par exemple, https://proxy.example.com.
Numéro de port du proxy: numéro de port utilisé pour la connexion au serveur proxy. Par exemple, 8080 ou 8443.
La sélection du protocole Proxy pour HTTP ou HTTPS est facultative.
Aucun proxy : liste d'hôtes séparés par des virgules pour contourner le proxy configuré dans la connexion.
Pour la connectivité privée, pour vous connecter à une base de données qui n'est pas externalisée sur Internet (par exemple, derrière un pare-feu), vous devez configurer une connexion sécurisée.
Choisissez la méthode de création d'une connexion basée sur l'emplacement dans la plateforme.
Suivez les instructions de la section Acquérir un jeton auprès d’ Azure AD pour autoriser les demandes d’une application cliente . Ces étapes créent une nouvelle identité. Une fois que vous avez créé l'identité, définissez les droits d'accès pour accorder à l'application l'accès à votre ADLS. La connexion Microsoft Azure Data Lake Storage utilisera l'ID client, le secret client et l'ID locataire associés pour l'application.
La connexion Microsoft Azure Data Lake Storage prend en charge les types de fichier suivants: Avro, CSV, Texte délimité, Excel, JSON, ORC, Parquet, SAS, SAV, SHP et XML.
Formats de table
Copy link to section
Outre le format Flat file, la connexion à l' Microsoft Azure Data Lake Storage prend en charge les formats de table Data Lake suivants : Delta Lake et Iceberg.