Microsoft Azure Data Lake Store-Verbindung
Für den Zugriff auf Ihre Daten im Microsoft Azure Data Lake Store müssen Sie ein Verbindungsasset dafür erstellen.
Azure Data Lake Store (ADLS) ist ein skalierbarer Datenspeicher- und Datenanalyseservice, der in Azure, der öffentlichen Cloud von Microsoft, gehostet wird. Die Microsoft Azure Data Lake Store-Verbindung unterstützt den Zugriff auf Azure Data Lake Storage-Repositorys der ersten Generation (Gen1) und der zweiten Generation (Gen2).
Verbindung zu Microsoft Azure Data Lake Store erstellen
Um das Verbindungsasset zu erstellen, benötigen Sie folgende Verbindungsdetails:
- WebHDFS-URL: Die WebHDFS-URL für den Zugriff auf HDFS.
Verwenden Sie das Formathttps://<account-name>.dfs.core.windows.net/<file-system>
, um eine Verbindung zu ADLS Gen2 herzustellen.
Dabei ist<account-name>
der Name, den Sie beim Erstellen der ADLS-Instanz verwendet haben.
Verwenden Sie für<file-system>
den Namen des von Ihnen erstellten Containers. Weitere Informationen finden Sie in der Dokumentation zu Microsoft Data Lake Storage Gen2.
- Tenant-ID: Die Tenant-ID (Mandanten-ID) von Azure Active Directory
- Client-ID: Die Client-ID für die Autorisierung des Zugriffs auf Microsoft Azure Data Lake Store
- Geheimer Clientschlüssel: Der Authentifizierungsschlüssel, der der Client-ID für die Autorisierung des Zugriffs auf Microsoft Azure Data Lake Store zugeordnet ist.
Für private Konnektivität müssen Sie eine sichere Verbindung einrichten, um eine Verbindung zu einer Datenbank herstellen zu können, die nicht über das Internet zugänglich ist (z. B. hinter einer Firewall).
Je nach Position auf der Plattform geeignete Methode zum Erstellen einer Verbindung auswählen
In einem Projekt Klicken Sie auf Zu Projekt hinzufügen > Verbindung. Weitere Informationen finden Sie unter Verbindung zu einem Projekt hinzufügen.
In einem Katalog
Klicken Sie auf Zu Katalog hinzufügen > Verbindung. Weitere Informationen finden Sie unter Verbindungsasset zu einem Katalog hinzufügen.
In einem Bereitstellungsbereich
Klicken Sie auf Zu Bereich hinzufügen > Verbindung. Weitere Informationen finden Sie unter Daten zu einem Bereitstellungsbereich hinzufügen.
Im Katalog der Plattformassets
Klicken Sie auf Neue Verbindung. Weitere Informationen finden Sie unter Plattformverbindungen hinzufügen.
Nächster Schritt: Fügen Sie Datenassets aus der Verbindung hinzu
- Weitere Informationen finden Sie unter Daten aus einer Verbindung in einem Projekt hinzufügen.
- Weitere Informationen finden Sie unter Daten aus einer Verbindung in einem Katalog hinzufügen.
Wo Sie diese Verbindung verwenden können
Sie können Microsoft Azure Data Lake Store-Verbindungen in den folgenden Arbeitsbereichen und Tools verwenden:
Projekte
- DataStage (DataStage-Service)
- Metadatenimport (Watson Knowledge Catalog)
- SPSS Modeler (Watson Studio)
Kataloge
- Katalog der Plattformassets
- Sonstige Kataloge (Watson Knowledge Catalog)
Authentifizierungskonfiguration für Azure Data Lake Store
Für die Konfiguration der Authentifizierung benötigen Sie eine Tenant-ID, eine Client-ID (oder Anwendungs-ID) und einen geheimen Clientschlüssel.
- Gen1:
- Erstellen Sie eine Azure Active Directory-Webanwendung (Azure AD), rufen Sie eine Anwendungs-ID, einen Authentifizierungsschlüssel und eine Tenant-ID ab.
- Anschließend müssen Sie die Azure AD-Anwendung der Kontodatei bzw. dem Kontoordner von Azure Data Lake Store zuordnen. Führen Sie Schritt 1, 2 und 3 im Abschnitt zur Authentifizierung zwischen Services mit Data Lake Store unter Verwendung von Azure Active Directory aus.
- Gen2:
- Gehen Sie wie im Abschnitt zum Anfordern eines Tokens von Azure AD zum Autorisieren von Anforderungen einer Clientanwendung beschrieben vor. Mit diesen Schritten wird eine neue Identität erstellt. Nachdem Sie die Identität erstellt haben, definieren Sie Berechtigungen, um der Anwendung Zugriff auf Ihre ADLS-Instanz zu erteilen. Die Microsoft Azure Data Lake Store-Verbindung verwendet die zugehörige Client-ID mit dem geheimen Clientschlüssel und der Tenant-ID für die Anwendung.
- Erteilen Sie der Azure-App mithilfe von Storage Explorer Zugriff auf den Speichercontainer. Entsprechende Anweisungen finden Sie im Abschnitt zum Verwalten von Verzeichnissen und und Dateien in Azure Data Lake Storage Gen2 mit Azure Storage Explorer.
Unterstützte Dateitypen
Die Microsoft Azure Data Lake Store-Verbindung unterstützt die folgenden Dateitypen: Avro, CSV, Text mit Trennzeichen, Excel, JSON, ORC, Parquet, SAS, SAV, SHP und XML.
Weitere Informationen
Übergeordnetes Thema: Unterstützte Verbindungen