Per accedere ai tuoi dati in Microsoft Azure Data Lake Storage, crea un asset di connessione per esso.
Azure Data Lake Storage (ADLS) è un servizio di archiviazione e analisi dei dati scalabile ospitato in Azure, il cloud pubblico di Microsoft. La connessione Microsoft Azure Data Lake Storage supporta l'accesso ai repository Gen1 e Gen2 Azure Data Lake Storage.
Crea una connessione a Microsoft Azure Data Lake Storage
Per creare l'asset di connessione, sono necessari i seguenti dettagli di connessione:
Microsoft Entra ID è un servizio di gestione degli accessi e delle identità basato sul cloud. Per ottenere i valori di connessione per il metodo di autenticazione Entra ID, accedere al portale Microsoft Azure e accedere al proprio account di archiviazione. Per informazioni su Microsoft Entra ID, vedere Che cos'è Microsoft Entra ID?.
Credenziale del segreto del client Entra ID
- IDTenant: l'ID del tenant di Microsoft Entra. Per trovare l'ID inquilino, andare su Microsoft Entra ID> Proprietà. Scorrere fino al campo Identificativo inquilino. Per ulteriori informazioni, vedere Come trovare l'ID inquilino di Microsoft Entra.
- Client ID: l'ID del cliente per autorizzare l'accesso a Microsoft Azure Data Lake Storage. Per trovare l'ID client della vostra applicazione, selezionate Microsoft Entra ID. Da Registrazioni di applicazioni, selezionate la vostra applicazione. Fare clic su Copia per copiare l'ID cliente dell'applicazione. Per ulteriori informazioni, vedere Registrazione di un'applicazione Microsoft Entra e creazione di un service principal.
- Segreto del cliente: la chiave di autenticazione associata all'ID del cliente per autorizzare l'accesso a Microsoft Azure Data Lake Storage. Per trovare il segreto del client per la vostra applicazione, selezionate Microsoft Entra ID. Da Registrazioni di applicazioni, selezionate la vostra applicazione. Andate in Certificati e segreti > Segreti del client. Fare clic su Copia per copiare il segreto del client esistente o su Nuovo segreto del client per creare un nuovo segreto del client e copiarlo. Per ulteriori informazioni, vedere Registrazione di un'applicazione Microsoft Entra e creazione di un service principal.
- Urb dell'account di archiviazione: URL dell'account di archiviazione.
Credenziale della password del nome utente di Entra ID
- Client ID: L'ID del cliente per autorizzare l'accesso a Microsoft Azure Data Lake Storage. Per trovare l'ID client della vostra applicazione, selezionate Microsoft Entra ID. Da Registrazioni di applicazioni, selezionate la vostra applicazione. Fare clic su Copia per copiare l'ID cliente dell'applicazione. Per ulteriori informazioni, vedere Registrazione di un'applicazione Microsoft Entra e creazione di un service principal.
- Username e Password: Nome utente e password dell'account Microsoft Azure Data Lake Storage. È necessaria l'autorizzazione per accedere al file senza autenticazione a più fattori.
- Urb dell'account di archiviazione: URL dell'account di archiviazione.
- URL WebHDFS : l'URL WebHDFS per accedere a HDFS.
Per connettersi a un ADLS della generazione 2, utilizzare il formatohttps://<account-name>.dfs.core.windows.net/<file-system>
Dove<account-name>
è il nome utilizzato quando è stata creata l'istanza ADLS.
Per<file-system>
, utilizza il nome del contenitore che hai creato. Per ulteriori informazioni, vedere le sezioni 'Documentazione di Microsoft Data Lake Storage 'Gen2 .
' - ID tenant: l'ID tenant Azure Active Directory
- ID client: l'ID client per autorizzare l'accesso a Microsoft Azure Data Lake Storage
- Segreto client: la chiave di autenticazione associata all'ID client per l'autorizzazione dell'accesso a Microsoft Azure Data Lake Storage
Selezionare Proxy server per accedere all'origine dati Azure Data Lake Storage tramite un server proxy. In base alla sua configurazione, un server proxy può fornire il bilanciamento del carico, una maggiore sicurezza e privacy. Le impostazioni del server proxy sono indipendenti dalle credenziali di autenticazione e dalla selezione delle credenziali personali o condivise.
- host proxy: l'URL proxy. Ad esempio,
https://proxy.example.com
. - Numero di porta proxy: il numero di porta per la connessione al server proxy. Ad esempio,
8080
o8443
. - La selezione del Protocollo proxy per HTTP o HTTPS è facoltativa.
Per la connettività privata, per stabilire una connessione a un database che non sia esternalizzato a internet (ad esempio, dietro un firewall), devi configurare una connessione sicura.
Scegliere il metodo per la creazione di una connessione in base alla posizione in cui ci si trova nella piattaforma
- In un progetto
- Fare clic su Asset> Nuovo asset> Connetti a una origine dati. Consultare Aggiunta di una connessione a un progetto.
- In uno spazio di distribuzione
- Fare clic su Importa asset> Accesso dati> Connessione. Consultare Aggiunta di asset di dati a uno spazio di distribuzione.
- Nel Platform assets catalog
- Fare clic su Nuova connessione. Consultare Aggiunta di connessioni di piattaforma.
Passo successivo: aggiungere gli asset di dati dalla connessione
Dove è possibile utilizzare questa connessione
È possibile utilizzare le connessioni Microsoft Azure Data Lake Storage nei seguenti spazi di lavoro e strumenti:
Progetti
- Decision Optimization
- SPSS Modeler
- Synthetic Data Generator
Cataloghi
- Platform assets catalog
Impostazione dell'autenticazione Azure Data Lake Storage
Per configurare l'autenticazione, hai bisogno di un ID tenant, di un client (o di un'applicazione) ID e segreto client.
- Gen1:
- Crea un'applicazione web Azure Active Directory (Azure AD), ottieni ID applicazione, chiave di autenticazione e ID tenant.
- Quindi, è necessario assegnare l'applicazione Azure AD alla cartella o al file dell'account Azure Data Lake Storage. Seguite i passaggi 1, 2 e 3 in Autenticazione da servizio a servizio con Azure Data Lake Storage utilizzando Azure Active Directory.
- Gen2:
- Seguite le istruzioni in Acquisire un token da Azure AD per autorizzare le richieste da un'applicazione client. Questi passi creano una nuova identità. Dopo aver creato l'identit ..., impostare le autorizzazioni per concedere all'applicazione l'accesso ADLS. La connessione Microsoft Azure Data Lake Storage utilizzerà l'ID client, il segreto client e l'ID tenant associati per l'applicazione.
- Fornire all'app Azure l'accesso al contenitore di archiviazione utilizzando Esplora risorse. Per istruzioni, vedere Utilizzo di Azure Storage Explorer per gestire directory e file in Azure Data Lake Storage Gen2.
Tipi di file supportati
La connessione Microsoft Azure Data Lake Storage supporta questi tipi di file: Avro, CSV, Testo delimitato, Excel, JSON, ORC, Parquet, SAS, SAV, SHP e XML.
Formati tabella
Oltre al file flat, la connessione Microsoft Azure Data Lake Storage supporta questi formati di tabella Data Lake: Delta Lake e Iceberg.
Ulteriori informazioni
Argomento principale Connessioni supportate