0 / 0
Retourner à la version anglaise de la documentation
Connexion Microsoft Azure Data Lake Storage
Dernière mise à jour : 28 nov. 2024
Connexion Microsoft Azure Data Lake Storage

Pour accéder à vos données dans Microsoft Azure Data Lake Storage, créez un actif de connexion pour ces données.

Azure Data Lake Storage (ADLS) est un service d'analyse et de stockage de données évolutif qui est hébergé dans Azure, le cloud public de Microsoft. La connexion Microsoft Azure Data Lake Storage prend en charge l'accès aux référentiels Gen1 et Gen2 Azure Data Lake Storage.

Créez une connexion à Microsoft Azure Data Lake Storage

Pour créer l'actif de connexion, il vous faut ces informations de connexion :

Remarque :Conditions préalables à l'authentification Entra ID:

Microsoft Entra ID est un service de gestion des identités et des accès basé sur le cloud. Pour obtenir les valeurs de connexion pour la méthode d'authentification Entra ID, connectez-vous au portail Microsoft Azure et accédez à votre compte de stockage. Pour plus d'informations sur Microsoft Entra ID, voir Qu'est-ce que Microsoft Entra ID?.

Données d'identification secrètes du client de l'ID d'entrée

  • Tenant ID : l'identifiant du locataire Microsoft Entra. Pour trouver l'identifiant du locataire, allez dans Microsoft Entra ID> Properties. Descendez jusqu'au champ Tenant ID. Pour plus d'informations, voir Comment trouver votre identifiant de locataire Microsoft Entra.
  • Client ID : L'identifiant du client pour autoriser l'accès à Microsoft Azure Data Lake Storage. Pour trouver l'identifiant du client de votre application, sélectionnez Microsoft Entra ID. Dans Inscriptions d'applications, sélectionnez votre application. Cliquez sur Copier pour copier l'ID client de votre application. Pour plus d'informations, voir Enregistrer une application Microsoft Entra et créer un principal de service.
  • Client secret : la clé d'authentification associée à l'identifiant du client pour autoriser l'accès à Microsoft Azure Data Lake Storage. Pour trouver le secret client de votre application, sélectionnez Microsoft Entra ID. Dans Inscriptions d'applications, sélectionnez votre application. Allez dans Certificats & secrets > Client secrets. Cliquez sur Copier pour copier le secret client existant ou cliquez sur Nouveau secret client pour créer un nouveau secret client et le copier. Pour plus d'informations, voir Enregistrer une application Microsoft Entra et créer un principal de service.
  • L'URL du compte de stockage : L'URL du compte de stockage.

Données d'identification du mot de passe de l'ID Entra

  • Identifiant du client: L'identifiant du client pour autoriser l'accès à Microsoft Azure Data Lake Storage. Pour trouver l'identifiant du client de votre application, sélectionnez Microsoft Entra ID. Dans Inscriptions d'applications, sélectionnez votre application. Cliquez sur Copier pour copier l'ID client de votre application. Pour plus d'informations, voir Enregistrer une application Microsoft Entra et créer un principal de service.
  • Nom d'utilisateur et Mot de passe : Nom d'utilisateur et mot de passe du compte Microsoft Azure Data Lake Storage. Vous devez obtenir l'autorisation d'accéder au fichier sans authentification multifactorielle.
  • L'URL du compte de stockage : L'URL du compte de stockage.
  • URL WebHDFS : URL WebHDFS pour l'accès à HDFS.
    Pour vous connecter à un ADLS de génération 2, utilisez le format https://<account-name>.dfs.core.windows.net/<file-system>
    <account-name> est le nom que vous avez utilisé lors de la création de l'instance ADLS.
    Pour <file-system>, utilisez le nom du conteneur que vous avez créé. Pour plus d'informations, consultez la documentation de Microsoft Data Lake Storage Gen2 .

  • ID locataire : l'ID du locataire Active Directory Azure
  • ID client: ID client permettant d'autoriser l'accès à Microsoft Azure Data Lake Storage
  • Secret client: clé d'authentification associée à l'ID client pour autoriser l'accès à Microsoft Azure Data Lake Storage

Sélectionnez Serveur proxy pour accéder à la source de données Azure Data Lake Storage via un serveur proxy. En fonction de sa configuration, un serveur proxy peut fournir un équilibrage de charge, une sécurité et une confidentialité accrues. Les paramètres du serveur proxy sont indépendants des données d'authentification et de la sélection des données d'identification personnelles ou partagées.

  • Hôte du proxy: URL du proxy. Par exemple, https://proxy.example.com.
  • Numéro de port du proxy: numéro de port utilisé pour la connexion au serveur proxy. Par exemple, 8080 ou 8443.
  • La sélection du protocole proxy pour HTTP ou HTTPS est facultative.

Pour la connectivité privée, pour vous connecter à une base de données qui n'est pas externalisée sur Internet (par exemple, derrière un pare-feu), vous devez configurer une connexion sécurisée.

Choisissez la méthode de création d'une connexion basée sur l'emplacement dans la plateforme.

Dans un projet
Cliquez sur Actifs > Nouvel actif > Connexion à une source de données. Voir Ajout d'une connexion à un projet.  
Dans un espace de déploiement
Cliquez sur Importer les actifs > Accès aux données > Connexion. Voir Ajout d'actifs de données à un espace de déploiement.
Dans le catalogue d'actifs de la plateforme
Cliquez sur Nouvelle connexion. Voir Ajout de connexions de plateforme.

Etape suivante : ajout d'actifs de données à partir de la connexion

Où vous pouvez utiliser cette connexion

Vous pouvez utiliser des connexions Microsoft Azure Data Lake Storage dans les espaces de travail et les outils suivants:

Projets

  • Decision Optimization
  • SPSS Modeler
  • Synthetic Data Generator

Catalogs

  • Platform assets catalog

Configuration de l'authentification Azure Data Lake Storage

Pour configurer l'authentification, vous avez besoin d'un ID titulaire, d'un ID client (ou d'application) et d'un secret client.

Types de fichier pris en charge

La connexion Microsoft Azure Data Lake Storage prend en charge les types de fichier suivants: Avro, CSV, Texte délimité, Excel, JSON, ORC, Parquet, SAS, SAV, SHP et XML.

Formats de table

En plus du fichier à plat, la connexion Microsoft Azure Data Lake Storage prend en charge les formats de table Data Lake suivants: Delta Lake et Iceberg.

En savoir plus

Azure Data Lake

Rubrique parent : Connexions prises en charge

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus