Erstellen Sie ein Verbindungsasset für Microsoft Azure Data Lake Storage, um auf Ihre Daten zuzugreifen.
Azure Data Lake Storage (ADLS) ist ein skalierbarer Datenspeicherungs-und Analyseservice, der in der öffentlichen Cloud von Azuregehostet wird. Die Verbindung Microsoft Azure Data Lake Storage unterstützt den Zugriff auf die Repositorys Gen1 und Gen2 Azure Data Lake Storage.
Verbindung zu Microsoft Azure Data Lake Storage erstellen
Um das Verbindungsasset zu erstellen, benötigen Sie folgende Verbindungsdetails:
Microsoft Entra ID ist ein Cloud-basierter Identitäts- und Zugangsverwaltungsdienst. Um Verbindungswerte für die Entra ID-Authentifizierungsmethode zu erhalten, melden Sie sich beim Microsoft Azure-Portal an und gehen Sie zu Ihrem Speicherkonto. Für Informationen über Microsoft Entra ID siehe Was ist Microsoft Entra ID?.
Berechtigungsnachweis für geheimen Clientschlüssel von Entra ID
- Tenant ID: Die Microsoft Entra Tenant ID. Um die Mieter-ID zu finden, gehen Sie zu Microsoft Entra ID> Eigenschaften. Blättern Sie nach unten zum Feld Mieter-ID. Weitere Informationen finden Sie unter Wie Sie Ihre Microsoft Entra Mieter-ID finden.
- Client-ID: Die Client-ID zur Autorisierung des Zugriffs auf Microsoft Azure Data Lake Storage. Um die Client-ID für Ihre Anwendung zu finden, wählen Sie Microsoft Entra ID. Wählen Sie unter Anwendungsregistrierungen Ihre Anwendung aus. Klicken Sie auf Kopieren, um die Client-ID Ihrer Anwendung zu kopieren. Weitere Informationen finden Sie unter Registrieren Sie eine Microsoft Entra-Anwendung und erstellen Sie einen Dienstprinzipal.
- Clientgeheimnis: Der Authentifizierungsschlüssel, der mit der Client-ID für die Autorisierung des Zugriffs auf Microsoft Azure Data Lake Storage verbunden ist. Um das Client-Geheimnis für Ihre Anwendung zu finden, wählen Sie Microsoft Entra ID. Wählen Sie unter Anwendungsregistrierungen Ihre Anwendung aus. Gehen Sie zu Zertifikate & Geheimnisse > Client-Geheimnisse. Klicken Sie auf Kopieren, um das vorhandene Client-Geheimnis zu kopieren, oder klicken Sie auf Neues Client-Geheimnis, um ein neues Client-Geheimnis zu erstellen und es zu kopieren. Weitere Informationen finden Sie unter Registrieren Sie eine Microsoft Entra-Anwendung und erstellen Sie einen Dienstprinzipal.
- Speicherkonto URL: Speicherkonto URL.
Berechtigungsnachweis für Entra ID aus Benutzername und Kennwort
- Client-ID: Die Client-ID zur Autorisierung des Zugriffs auf Microsoft Azure Data Lake Storage. Um die Client-ID für Ihre Anwendung zu finden, wählen Sie Microsoft Entra ID. Wählen Sie unter Anwendungsregistrierungen Ihre Anwendung aus. Klicken Sie auf Kopieren, um die Client-ID Ihrer Anwendung zu kopieren. Weitere Informationen finden Sie unter Registrieren Sie eine Microsoft Entra-Anwendung und erstellen Sie einen Dienstprinzipal.
- Benutzername und Passwort: Benutzername und Passwort für das Microsoft Azure Data Lake Storage Konto. Sie benötigen eine Berechtigung für den Zugriff auf die Datei ohne Multi-Faktor-Authentifizierung.
- Speicherkonto URL: Speicherkonto URL.
- WebHDFS-URL: Die WebHDFS-URL für den Zugriff auf HDFS.
Verwenden Sie zum Herstellen einer Verbindung zu einer Gen 2 ADLS das Formathttps://<account-name>.dfs.core.windows.net/<file-system>
. Dabei steht<account-name>
für den Namen, den Sie bei der Erstellung der ADLS-Instanz verwendet haben.
Verwenden Sie für<file-system>
den Namen des von Ihnen erstellten Containers. Weitere Informationen finden Sie in der Microsoft Data Lake Storage Gen2.
' - Tenant-ID: Die Tenant-ID (Mandanten-ID) von Azure Active Directory
- Client-ID: Die Client-ID für die Autorisierung des Zugriffs auf Microsoft Azure Data Lake Storage
- Geheimer Clientschlüssel: Der Authentifizierungsschlüssel, der der Client-ID für die Autorisierung des Zugriffs auf Microsoft Azure Data Lake Storage zugeordnet ist.
Wählen Sie Server-Proxy aus, um über einen Proxy-Server auf die Datenquelle Azure Data Lake Storage zuzugreifen. Je nach Konfiguration kann ein Proxy-Server Lastausgleich, erhöhte Sicherheit und Datenschutz bereitstellen. Die Proxy-Server-Einstellungen sind unabhängig von den Authentifizierungsnachweisen und der Auswahl persönlicher oder gemeinsam genutzter Berechtigungsnachweise.
- Proxy-Host: Die Proxy-URL. Zum Beispiel
https://proxy.example.com
. - Proxy port number: Die Portnummer für die Verbindung zum Proxy-Server. Beispiel:
8080
oder8443
. - Die Auswahl des Proxy-Protokolls für HTTP oder HTTPS ist optional.
Für private Konnektivität müssen Sie eine sichere Verbindung einrichten, um eine Verbindung zu einer Datenbank herstellen zu können, die nicht über das Internet zugänglich ist (z. B. hinter einer Firewall).
Je nach Position auf der Plattform geeignete Methode zum Erstellen einer Verbindung auswählen
- In einem Projekt
- Klicken Sie auf Assets > Neues Asset > Verbindung zu einer Datenquelle herstellen. Weitere Informationen finden Sie unter Verbindung zu einem Projekt hinzufügen.
- In einem Katalog
- Klicken Sie auf Zu Katalog hinzufügen > Verbindung. Weitere Informationen finden Sie unter Verbindungsasset zu einem Katalog hinzufügen.
- In einem Bereitstellungsbereich
- Klicken Sie auf Assets importieren > Datenzugriff > Verbindung. Siehe Datenassets zu einem Bereitstellungsbereich hinzufügen.
- Im Katalog der Plattformressourcen
- Klicken Sie auf Neue Verbindung. Weitere Informationen finden Sie unter Hinzufügen von Plattformverbindungen.
Nächster Schritt: Fügen Sie Datenassets aus der Verbindung hinzu
Weitere Informationen finden Sie unter Daten aus einer Verbindung in einem Projekt hinzufügen.
Weitere Informationen finden Sie unter Daten aus einer Verbindung in einem Katalog hinzufügen.
Wo Sie diese Verbindung verwenden können
Sie können Microsoft Azure Data Lake Storage -Verbindungen in den folgenden Arbeitsbereichen und Tools verwenden:
Projekte
- Datenqualitätsregeln (IBM Knowledge Catalog)
- DataStage (DataStage -Service) Siehe Verbindung zu einer Datenquelle in DataStage.
- Decision Optimizationwatsonx.ai Studio und watsonx.ai Runtime)
- Anreicherung von Metadaten (IBM Knowledge Catalog)
- Metadata import (IBM Knowledge Catalog)
- SPSS Modelerwatsonx.ai Studio)
Kataloge
Platform assets catalog
Andere Kataloge (IBM Knowledge Catalog)
Azure Data Lake Storage-Authentifizierungskonfiguration
Für die Konfiguration der Authentifizierung benötigen Sie eine Tenant-ID, eine Client-ID (oder Anwendungs-ID) und einen geheimen Clientschlüssel.
- Gen1:
- Erstellen Sie eine Azure Active Directory-Webanwendung (Azure AD), rufen Sie eine Anwendungs-ID, einen Authentifizierungsschlüssel und eine Tenant-ID ab.
- Anschließend müssen Sie die Azure AD-Anwendung der Kontodatei oder dem Ordner Azure Data Lake Storage zuordnen. Führen Sie die Schritte 1, 2 und 3 unter Service-to-Service-Authentifizierung mit Azure Data Lake Storage unter Verwendung von Azure Active Directory aus.
- Gen2:
- Befolgen Sie die Anweisungen in Erwerben Sie ein Token von Azure AD, um Anfragen von einer Clientanwendung zu autorisieren. Mit diesen Schritten wird eine neue Identität erstellt. Nachdem Sie die Identität erstellt haben, definieren Sie Berechtigungen, um der Anwendung Zugriff auf Ihre ADLS-Instanz zu erteilen. Die Verbindung Microsoft Azure Data Lake Storage verwendet die zugehörige Client-ID, den geheimen Clientschlüssel und die Tenant-ID für die Anwendung.
- Erteilen Sie der Azure-App mithilfe von Storage Explorer Zugriff auf den Speichercontainer. Anweisungen finden Sie unter Verwenden von Azure Storage Explorer zur Verwaltung von Verzeichnissen und Dateien in Azure Data Lake Storage Gen2.
Unterstützte Dateitypen
Die Verbindung Microsoft Azure Data Lake Storage unterstützt folgende Dateitypen: Avro, CSV, Text mit Trennzeichen, Excel, JSON, ORC, Parquet, SAS, SAV, SHP und XML.
Tabellenformate
Zusätzlich zur Flachdatei unterstützt die Microsoft Azure Data Lake Storage -Verbindung die folgenden Data Lake-Tabellenformate: Delta Lake und Iceberg.
Weitere Informationen
Übergeordnetes Thema: Unterstützte Verbindungen