0 / 0
Zurück zur englischen Version der Dokumentation
Microsoft Azure Data Lake Storage -Verbindung
Letzte Aktualisierung: 28. Nov. 2024
Microsoft Azure Data Lake Storage -Verbindung

Erstellen Sie ein Verbindungsasset für Microsoft Azure Data Lake Storage, um auf Ihre Daten zuzugreifen.

Azure Data Lake Storage (ADLS) ist ein skalierbarer Datenspeicherungs-und Analyseservice, der in der öffentlichen Cloud von Azuregehostet wird. Die Verbindung Microsoft Azure Data Lake Storage unterstützt den Zugriff auf die Repositorys Gen1 und Gen2 Azure Data Lake Storage.

Verbindung zu Microsoft Azure Data Lake Storage erstellen

Um das Verbindungsasset zu erstellen, benötigen Sie folgende Verbindungsdetails:

Hinweis:Voraussetzung für die Entra-ID-Authentifizierung:

Microsoft Entra ID ist ein Cloud-basierter Identitäts- und Zugangsverwaltungsdienst. Um Verbindungswerte für die Entra ID-Authentifizierungsmethode zu erhalten, melden Sie sich beim Microsoft Azure-Portal an und gehen Sie zu Ihrem Speicherkonto. Für Informationen über Microsoft Entra ID siehe Was ist Microsoft Entra ID?.

Berechtigungsnachweis für geheimen Clientschlüssel von Entra ID

  • Tenant ID: Die Microsoft Entra Tenant ID. Um die Mieter-ID zu finden, gehen Sie zu Microsoft Entra ID> Eigenschaften. Blättern Sie nach unten zum Feld Mieter-ID. Weitere Informationen finden Sie unter Wie Sie Ihre Microsoft Entra Mieter-ID finden.
  • Client-ID: Die Client-ID zur Autorisierung des Zugriffs auf Microsoft Azure Data Lake Storage. Um die Client-ID für Ihre Anwendung zu finden, wählen Sie Microsoft Entra ID. Wählen Sie unter Anwendungsregistrierungen Ihre Anwendung aus. Klicken Sie auf Kopieren, um die Client-ID Ihrer Anwendung zu kopieren. Weitere Informationen finden Sie unter Registrieren Sie eine Microsoft Entra-Anwendung und erstellen Sie einen Dienstprinzipal.
  • Clientgeheimnis: Der Authentifizierungsschlüssel, der mit der Client-ID für die Autorisierung des Zugriffs auf Microsoft Azure Data Lake Storage verbunden ist. Um das Client-Geheimnis für Ihre Anwendung zu finden, wählen Sie Microsoft Entra ID. Wählen Sie unter Anwendungsregistrierungen Ihre Anwendung aus. Gehen Sie zu Zertifikate & Geheimnisse > Client-Geheimnisse. Klicken Sie auf Kopieren, um das vorhandene Client-Geheimnis zu kopieren, oder klicken Sie auf Neues Client-Geheimnis, um ein neues Client-Geheimnis zu erstellen und es zu kopieren. Weitere Informationen finden Sie unter Registrieren Sie eine Microsoft Entra-Anwendung und erstellen Sie einen Dienstprinzipal.
  • Speicherkonto URL: Speicherkonto URL.

Berechtigungsnachweis für Entra ID aus Benutzername und Kennwort

  • Client-ID: Die Client-ID zur Autorisierung des Zugriffs auf Microsoft Azure Data Lake Storage. Um die Client-ID für Ihre Anwendung zu finden, wählen Sie Microsoft Entra ID. Wählen Sie unter Anwendungsregistrierungen Ihre Anwendung aus. Klicken Sie auf Kopieren, um die Client-ID Ihrer Anwendung zu kopieren. Weitere Informationen finden Sie unter Registrieren Sie eine Microsoft Entra-Anwendung und erstellen Sie einen Dienstprinzipal.
  • Benutzername und Passwort: Benutzername und Passwort für das Microsoft Azure Data Lake Storage Konto. Sie benötigen eine Berechtigung für den Zugriff auf die Datei ohne Multi-Faktor-Authentifizierung.
  • Speicherkonto URL: Speicherkonto URL.
  • WebHDFS-URL: Die WebHDFS-URL für den Zugriff auf HDFS.
    Verwenden Sie zum Herstellen einer Verbindung zu einer Gen 2 ADLS das Format https://<account-name>.dfs.core.windows.net/<file-system>
    . Dabei steht <account-name> für den Namen, den Sie bei der Erstellung der ADLS-Instanz verwendet haben.
    Verwenden Sie für <file-system> den Namen des von Ihnen erstellten Containers. Weitere Informationen finden Sie in der Microsoft Data Lake Storage Gen2.
    '
  • Tenant-ID: Die Tenant-ID (Mandanten-ID) von Azure Active Directory
  • Client-ID: Die Client-ID für die Autorisierung des Zugriffs auf Microsoft Azure Data Lake Storage
  • Geheimer Clientschlüssel: Der Authentifizierungsschlüssel, der der Client-ID für die Autorisierung des Zugriffs auf Microsoft Azure Data Lake Storage zugeordnet ist.

Wählen Sie Server-Proxy aus, um über einen Proxy-Server auf die Datenquelle Azure Data Lake Storage zuzugreifen. Je nach Konfiguration kann ein Proxy-Server Lastausgleich, erhöhte Sicherheit und Datenschutz bereitstellen. Die Proxy-Server-Einstellungen sind unabhängig von den Authentifizierungsnachweisen und der Auswahl persönlicher oder gemeinsam genutzter Berechtigungsnachweise.

  • Proxy-Host: Die Proxy-URL. Zum Beispiel https://proxy.example.com.
  • Proxy port number: Die Portnummer für die Verbindung zum Proxy-Server. Beispiel: 8080 oder 8443.
  • Die Auswahl des Proxy-Protokolls für HTTP oder HTTPS ist optional.

Für private Konnektivität müssen Sie eine sichere Verbindung einrichten, um eine Verbindung zu einer Datenbank herstellen zu können, die nicht über das Internet zugänglich ist (z. B. hinter einer Firewall).

Je nach Position auf der Plattform geeignete Methode zum Erstellen einer Verbindung auswählen

In einem Projekt
Klicken Sie auf Assets > Neues Asset > Verbindung zu einer Datenquelle herstellen. Weitere Informationen finden Sie unter Verbindung zu einem Projekt hinzufügen.
In einem Katalog
Klicken Sie auf Zu Katalog hinzufügen > Verbindung. Weitere Informationen finden Sie unter Verbindungsasset zu einem Katalog hinzufügen.
In einem Bereitstellungsbereich
Klicken Sie auf Assets importieren > Datenzugriff > Verbindung. Siehe Datenassets zu einem Bereitstellungsbereich hinzufügen.
Im Katalog der Plattformressourcen
Klicken Sie auf Neue Verbindung. Weitere Informationen finden Sie unter Hinzufügen von Plattformverbindungen.

Nächster Schritt: Fügen Sie Datenassets aus der Verbindung hinzu

Wo Sie diese Verbindung verwenden können

Sie können Microsoft Azure Data Lake Storage -Verbindungen in den folgenden Arbeitsbereichen und Tools verwenden:

Projekte

  • Datenqualitätsregeln (IBM Knowledge Catalog)
  • DataStage (DataStage -Service) Siehe Verbindung zu einer Datenquelle in DataStage.
  • Decision Optimizationwatsonx.ai Studio und watsonx.ai Runtime)
  • Anreicherung von Metadaten (IBM Knowledge Catalog)
  • Metadata import (IBM Knowledge Catalog)
  • SPSS Modelerwatsonx.ai Studio)

Kataloge

  • Platform assets catalog

  • Andere Kataloge (IBM Knowledge Catalog)

Azure Data Lake Storage-Authentifizierungskonfiguration

Für die Konfiguration der Authentifizierung benötigen Sie eine Tenant-ID, eine Client-ID (oder Anwendungs-ID) und einen geheimen Clientschlüssel.

Unterstützte Dateitypen

Die Verbindung Microsoft Azure Data Lake Storage unterstützt folgende Dateitypen: Avro, CSV, Text mit Trennzeichen, Excel, JSON, ORC, Parquet, SAS, SAV, SHP und XML.

Tabellenformate

Zusätzlich zur Flachdatei unterstützt die Microsoft Azure Data Lake Storage -Verbindung die folgenden Data Lake-Tabellenformate: Delta Lake und Iceberg.

Weitere Informationen

Azure Data Lake

Übergeordnetes Thema: Unterstützte Verbindungen

Generative KI-Suche und -Antwort
Diese Antworten werden von einem großen Sprachmodell in watsonx.ai basierend auf dem Inhalt der Produktdokumentation generiert. Weitere Informationen