Erstellen Sie ein Verbindungsasset für Microsoft Azure Data Lake Storage, um auf Ihre Daten zuzugreifen.
Azure Data Lake Storage (ADLS) ist ein skalierbarer Datenspeicherungs-und Analyseservice, der in der öffentlichen Cloud von Azuregehostet wird. Die Verbindung Microsoft Azure Data Lake Storage unterstützt den Zugriff auf die Repositorys Gen1 und Gen2 Azure Data Lake Storage.
Verbindung zu Microsoft Azure Data Lake Storage erstellen
Copy link to section
Um das Verbindungsasset zu erstellen, benötigen Sie folgende Verbindungsdetails:
Hinweis:Voraussetzung für die Entra-ID-Authentifizierung:
Berechtigungsnachweis für geheimen Clientschlüssel von Entra ID
Tenant ID: Die Microsoft Entra Tenant ID. Um die Mieter-ID zu finden, gehen Sie zu Microsoft Entra ID> Eigenschaften. Blättern Sie nach unten zum Feld Mieter-ID. Weitere Informationen finden Sie unter Wie Sie Ihre Microsoft Entra Mieter-ID finden.
Client-ID: Die Client-ID zur Autorisierung des Zugriffs auf Microsoft Azure Data Lake Storage. Um die Client-ID für Ihre Anwendung zu finden, wählen Sie Microsoft Entra ID. Wählen Sie unter Anwendungsregistrierungen Ihre Anwendung aus. Klicken Sie auf Kopieren, um die Client-ID Ihrer Anwendung zu kopieren. Weitere Informationen finden Sie unter Registrieren Sie eine Microsoft Entra-Anwendung und erstellen Sie einen Dienstprinzipal.
Clientgeheimnis: Der Authentifizierungsschlüssel, der mit der Client-ID für die Autorisierung des Zugriffs auf Microsoft Azure Data Lake Storage verbunden ist. Um das Client-Geheimnis für Ihre Anwendung zu finden, wählen Sie Microsoft Entra ID. Wählen Sie unter Anwendungsregistrierungen Ihre Anwendung aus. Gehen Sie zu Zertifikate & Geheimnisse > Client-Geheimnisse. Klicken Sie auf Kopieren, um das vorhandene Client-Geheimnis zu kopieren, oder klicken Sie auf Neues Client-Geheimnis, um ein neues Client-Geheimnis zu erstellen und es zu kopieren. Weitere Informationen finden Sie unter Registrieren Sie eine Microsoft Entra-Anwendung und erstellen Sie einen Dienstprinzipal.
Speicherkonto URL : Speicherkonto URL.
Berechtigungsnachweis für Entra ID aus Benutzername und Kennwort
Client-ID: Die Client-ID zur Autorisierung des Zugriffs auf Microsoft Azure Data Lake Storage. Um die Client-ID für Ihre Anwendung zu finden, wählen Sie Microsoft Entra ID. Wählen Sie unter Anwendungsregistrierungen Ihre Anwendung aus. Klicken Sie auf Kopieren, um die Client-ID Ihrer Anwendung zu kopieren. Weitere Informationen finden Sie unter Registrieren Sie eine Microsoft Entra-Anwendung und erstellen Sie einen Dienstprinzipal.
Benutzername und Passwort: Benutzername und Passwort für das Microsoft Azure Data Lake Storage Konto. Sie benötigen eine Berechtigung für den Zugriff auf die Datei ohne Multi-Faktor-Authentifizierung.
Speicherkonto URL : Speicherkonto URL.
WebHDFS-URL: Die WebHDFS-URL für den Zugriff auf HDFS. Verwenden Sie zum Herstellen einer Verbindung zu einer Gen 2 ADLS das Format https://<account-name>.dfs.core.windows.net/<file-system> . Dabei steht <account-name> für den Namen, den Sie bei der Erstellung der ADLS-Instanz verwendet haben. Verwenden Sie für <file-system> den Namen des von Ihnen erstellten Containers. Weitere Informationen finden Sie in der Dokumentation zu Microsoft Data Lake Storage Gen2.
Tenant-ID: Die Tenant-ID (Mandanten-ID) von Azure Active Directory
Client-ID: Die Client-ID für die Autorisierung des Zugriffs auf Microsoft Azure Data Lake Storage
Geheimer Clientschlüssel: Der Authentifizierungsschlüssel, der der Client-ID für die Autorisierung des Zugriffs auf Microsoft Azure Data Lake Storage zugeordnet ist.
Wählen Sie Server-Proxy aus, um über einen Proxy-Server auf die Datenquelle Azure Data Lake Storage zuzugreifen. Je nach Konfiguration kann ein Proxy-Server Lastausgleich, erhöhte Sicherheit und Datenschutz bereitstellen. Die Proxy-Server-Einstellungen sind unabhängig von den Authentifizierungsnachweisen und der Auswahl persönlicher oder gemeinsam genutzter Berechtigungsnachweise.
Proxy-Host : Der Proxy URL. Zum Beispiel https://proxy.example.com.
Proxy port number: Die Portnummer für die Verbindung zum Proxy-Server. Beispiel: 8080 oder 8443.
Die Auswahl des Proxy-Protokolls für HTTP oder HTTPS ist optional.
Kein Proxy : Eine durch Kommas getrennte Liste von Hosts, um den in der Verbindung konfigurierten Proxy zu umgehen.
Für private Konnektivität müssen Sie eine sichere Verbindung einrichten, um eine Verbindung zu einer Datenbank herstellen zu können, die nicht über das Internet zugänglich ist (z. B. hinter einer Firewall).
Je nach Position auf der Plattform geeignete Methode zum Erstellen einer Verbindung auswählen
Copy link to section
In einem Projekt
Klicken Sie auf Assets > Neues Asset > Verbindung zu einer Datenquelle herstellen. Weitere Informationen finden Sie unter Verbindung zu einem Projekt hinzufügen.
Azure Data Lake Storage-Authentifizierungskonfiguration
Copy link to section
Zum Konfigurieren der Authentifizierung benötigen Sie eine Tenant-ID, eine Client-ID (oder Anwendungs-ID) und einen geheimen Clientschlüssel.
Gen1:
Erstellen Sie eine Azure Active Directory-Webanwendung (Azure AD), rufen Sie eine Anwendungs-ID, einen Authentifizierungsschlüssel und eine Tenant-ID ab.
Befolgen Sie die Anweisungen in Erwerben Sie ein Token von Azure AD, um Anfragen von einer Client-Anwendung zu autorisieren. Mit diesen Schritten wird eine neue Identität erstellt. Nachdem Sie die Identität erstellt haben, definieren Sie Berechtigungen, um der Anwendung Zugriff auf Ihre ADLS-Instanz zu erteilen. Die Verbindung Microsoft Azure Data Lake Storage verwendet die zugehörige Client-ID, den geheimen Clientschlüssel und die Tenant-ID für die Anwendung.
Die Verbindung Microsoft Azure Data Lake Storage unterstützt folgende Dateitypen: Avro, CSV, Text mit Trennzeichen, Excel, JSON, ORC, Parquet, SAS, SAV, SHP und XML.
Tabellenformate
Copy link to section
Zusätzlich zu Flat File unterstützt die Verbindung Microsoft Azure Data Lake Storage die folgenden Data Lake-Tabellenformate: Delta Lake und Iceberg.
Über den Einsatz von Cookies auf dieser WebsiteUnsere Websites benötigen einige Cookies, um ordnungsgemäß zu funktionieren (erforderlich). Darüber hinaus können mit Ihrer Zustimmung weitere Cookies verwendet werden, um die Nutzung der Website zu analysieren, die Benutzerfreundlichkeit zu verbessern und Werbung zu schalten.Weitere Informationen finden Sie in Ihren Cookie-Benutzervorgaben. Durch den Besuch unserer Website erklären Sie sich mit der Verarbeitung von Informationen einverstanden, wie in der IBMDatenschutzbestimmung beschrieben.Um eine reibungslose Navigation zu ermöglichen, werden Ihre Cookie-Präferenzen über die hier aufgeführten IBM Web-Domains hinweg gemeinsam genutzt.