0 / 0
Zurück zur englischen Version der Dokumentation
Apache HDFS-Verbindung
Apache HDFS-Verbindung

Apache HDFS-Verbindung

Sie können ein Verbindungsasset für den Zugriff auf Ihre Daten in Apache HDFS erstellen.

Apache Hadoop Distributed File System (HDFS) ist ein verteiltes Dateisystem, das auf Standardhardware ausgeführt werden kann. Apache HDFS war früher Hortonworks HDFS.

Eine Verbindung zu Apache HDFS erstellen

Zum Erstellen des Verbindungsassets benötigen Sie die folgenden Verbindungsdetails. Die WebHDFS-URL ist erforderlich.

  • WebHDFS-URL für den Zugriff auf HDFS.
  • Hive HTTP-Pfad: Der Pfad des Endpunkts wie gateway/default/hive, wenn der Server für den HTTP-Transportmodus konfiguriert ist.
  • Hive -Host: Der Hostname oder die IP-Adresse des Apache Hive -Servers.
  • Hive-Portnummer: Die Port-Nummer des Apache-Hive-Servers. Der Standardwert ist 10000.
  • Hive-Datenbank: Die Datenbank in Apache Hive.
  • SSL-Zertifikat (falls für den Apache Hive -Server erforderlich)

Berechtigungsnachweise

Der Benutzername ist erforderlich.

  • Benutzername und Kennwort
  • Hive -Benutzer und -Kennwort für die Verbindung zu Apache Hive

Für private Konnektivität müssen Sie eine sichere Verbindung einrichten, um eine Verbindung zu einer Datenbank herstellen zu können, die nicht über das Internet zugänglich ist (z. B. hinter einer Firewall).

Je nach Position auf der Plattform geeignete Methode zum Erstellen einer Verbindung auswählen

In einem Projekt Klicken Sie auf Assets > Neues Asset > Datenzugriffstools > Verbindung. Weitere Informationen finden Sie unter Verbindung zu einem Projekt hinzufügen.


In einem Katalog Klicken Sie auf Zu Katalog hinzufügen > Verbindung. Weitere Informationen finden Sie unter Verbindungsasset zu einem Katalog hinzufügen.


In einem Bereitstellungsbereich Klicken Sie auf Zu Bereich hinzufügen > Connection. Siehe Verbindungen zu einem Bereitstellungsbereich hinzufügen.


Klicken Sie im Platform assets catalog auf Neue Verbindung. Weitere Informationen finden Sie unter Hinzufügen von Plattformverbindungen.

Nächster Schritt: Fügen Sie Datenassets aus der Verbindung hinzu

Wo Sie diese Verbindung verwenden können

Sie können Apache HDFS-Verbindungen in den folgenden Arbeitsbereichen und Tools verwenden:

Projekte

  • Data Refinery (Watson Studio oder Watson Knowledge Catalog)
  • DataStage (DataStage)
  • Metadata import (Watson Knowledge Catalog)
  • SPSS Modeler (Watson Studio)

Kataloge

  • Platform assets catalog
  • Sonstige Kataloge (Watson Knowledge Catalog)

Apache HDFS-Konfiguration

Hadoop -Cluster installieren und einrichten

Unterstützte Dateitypen

Die Apache HDFS-Verbindung unterstützt die folgenden Dateitypen: Avro, CSV, Text mit Trennzeichen, Excel, JSON, OR, Parquet, SAS, SAV, SHP und XML.

Weitere Informationen

Apache HDFS Users Guide

Übergeordnetes Thema: Unterstützte Verbindungen