Pour accéder à vos données dans Microsoft Azure Data Lake Storage, créez un actif de connexion pour ces données.
Azure Data Lake Storage (ADLS) est un service d'analyse et de stockage de données évolutif qui est hébergé dans Azure, le cloud public de Microsoft. La connexion Microsoft Azure Data Lake Storage prend en charge l'accès aux référentiels Gen1 et Gen2 Azure Data Lake Storage.
Créez une connexion à Microsoft Azure Data Lake Storage
Pour créer l'actif de connexion, il vous faut ces informations de connexion :
Microsoft Entra ID est un service de gestion des identités et des accès basé sur le cloud. Pour obtenir les valeurs de connexion pour la méthode d'authentification Entra ID, connectez-vous au portail Microsoft Azure et accédez à votre compte de stockage. Pour plus d'informations sur Microsoft Entra ID, voir Qu'est-ce que Microsoft Entra ID?.
Données d'identification secrètes du client de l'ID d'entrée
- Tenant ID : l'identifiant du locataire Microsoft Entra. Pour trouver l'identifiant du locataire, allez dans Microsoft Entra ID> Properties. Descendez jusqu'au champ Tenant ID. Pour plus d'informations, voir Comment trouver votre identifiant de locataire Microsoft Entra.
- Client ID : L'identifiant du client pour autoriser l'accès à Microsoft Azure Data Lake Storage. Pour trouver l'identifiant du client de votre application, sélectionnez Microsoft Entra ID. Dans Inscriptions d'applications, sélectionnez votre application. Cliquez sur Copier pour copier l'ID client de votre application. Pour plus d'informations, voir Enregistrer une application Microsoft Entra et créer un principal de service.
- Client secret : la clé d'authentification associée à l'identifiant du client pour autoriser l'accès à Microsoft Azure Data Lake Storage. Pour trouver le secret client de votre application, sélectionnez Microsoft Entra ID. Dans Inscriptions d'applications, sélectionnez votre application. Allez dans Certificats & secrets > Client secrets. Cliquez sur Copier pour copier le secret client existant ou cliquez sur Nouveau secret client pour créer un nouveau secret client et le copier. Pour plus d'informations, voir Enregistrer une application Microsoft Entra et créer un principal de service.
- L'URL du compte de stockage : L'URL du compte de stockage.
Données d'identification du mot de passe de l'ID Entra
- Identifiant du client: L'identifiant du client pour autoriser l'accès à Microsoft Azure Data Lake Storage. Pour trouver l'identifiant du client de votre application, sélectionnez Microsoft Entra ID. Dans Inscriptions d'applications, sélectionnez votre application. Cliquez sur Copier pour copier l'ID client de votre application. Pour plus d'informations, voir Enregistrer une application Microsoft Entra et créer un principal de service.
- Nom d'utilisateur et Mot de passe : Nom d'utilisateur et mot de passe du compte Microsoft Azure Data Lake Storage. Vous devez obtenir l'autorisation d'accéder au fichier sans authentification multifactorielle.
- L'URL du compte de stockage : L'URL du compte de stockage.
- URL WebHDFS : URL WebHDFS pour l'accès à HDFS.
Pour vous connecter à un ADLS de génération 2, utilisez le formathttps://<account-name>.dfs.core.windows.net/<file-system>
où<account-name>
est le nom que vous avez utilisé lors de la création de l'instance ADLS.
Pour<file-system>
, utilisez le nom du conteneur que vous avez créé. Pour plus d'informations, consultez la documentation de Microsoft Data Lake Storage Gen2 .
- ID locataire : l'ID du locataire Active Directory Azure
- ID client: ID client permettant d'autoriser l'accès à Microsoft Azure Data Lake Storage
- Secret client: clé d'authentification associée à l'ID client pour autoriser l'accès à Microsoft Azure Data Lake Storage
Sélectionnez Serveur proxy pour accéder à la source de données Azure Data Lake Storage via un serveur proxy. En fonction de sa configuration, un serveur proxy peut fournir un équilibrage de charge, une sécurité et une confidentialité accrues. Les paramètres du serveur proxy sont indépendants des données d'authentification et de la sélection des données d'identification personnelles ou partagées.
- Hôte du proxy: URL du proxy. Par exemple,
https://proxy.example.com
. - Numéro de port du proxy: numéro de port utilisé pour la connexion au serveur proxy. Par exemple,
8080
ou8443
. - La sélection du protocole proxy pour HTTP ou HTTPS est facultative.
Pour la connectivité privée, pour vous connecter à une base de données qui n'est pas externalisée sur Internet (par exemple, derrière un pare-feu), vous devez configurer une connexion sécurisée.
Choisissez la méthode de création d'une connexion basée sur l'emplacement dans la plateforme.
- Dans un projet
- Cliquez sur Actifs > Nouvel actif > Connexion à une source de données. Voir Ajout d'une connexion à un projet.
- Dans un espace de déploiement
- Cliquez sur Importer les actifs > Accès aux données > Connexion. Voir Ajout d'actifs de données à un espace de déploiement.
- Dans le catalogue d'actifs de la plateforme
- Cliquez sur Nouvelle connexion. Voir Ajout de connexions de plateforme.
Etape suivante : ajout d'actifs de données à partir de la connexion
Où vous pouvez utiliser cette connexion
Vous pouvez utiliser des connexions Microsoft Azure Data Lake Storage dans les espaces de travail et les outils suivants:
Projets
- Decision Optimization
- SPSS Modeler
- Synthetic Data Generator
Catalogs
- Platform assets catalog
Configuration de l'authentification Azure Data Lake Storage
Pour configurer l'authentification, vous avez besoin d'un ID titulaire, d'un ID client (ou d'application) et d'un secret client.
- Gen1:
- Créez une application Web Azure Active Directory (Azure AD), obtenez un ID d'application, une clé d'authentification et un ID locataire.
- Vous devez ensuite affecter l'application Azure AD au fichier ou au dossier du compte Azure Data Lake Storage. Suivez les étapes 1, 2 et 3 de la section Authentification de service à service avec Azure Data Lake Storage à l’aide Azure Active Directory .
- Gen2:
- Suivez les instructions de la section Acquérir un jeton auprès d’ Azure AD pour autoriser les demandes d’une application cliente . Ces étapes créent une nouvelle identité. Une fois que vous avez créé l'identité, définissez les droits d'accès pour accorder à l'application l'accès à votre ADLS. La connexion Microsoft Azure Data Lake Storage utilisera l'ID client, le secret client et l'ID locataire associés pour l'application.
- Donnez à l'application Azure l'accès au conteneur de stockage à l'aide de l'explorateur de stockage. Pour obtenir des instructions, consultez Utiliser Azure Storage Explorer pour gérer les répertoires et les fichiers dans Azure Data Lake Storage Gen2 .
Types de fichier pris en charge
La connexion Microsoft Azure Data Lake Storage prend en charge les types de fichier suivants: Avro, CSV, Texte délimité, Excel, JSON, ORC, Parquet, SAS, SAV, SHP et XML.
Formats de table
En plus du fichier à plat, la connexion Microsoft Azure Data Lake Storage prend en charge les formats de table Data Lake suivants: Delta Lake et Iceberg.
En savoir plus
Rubrique parent : Connexions prises en charge