Analytics Engine HDFS-Verbindung

Verwenden Sie die Analytics Engine HDFS-Verbindung, um über die WebHDFS-API eine Verbindung zu IBM Analytics Engine herzustellen.

IBM Analytics Engine ist ein Hadoop- und Spark-Service in IBM Cloud, der eine Umgebung für die Entwicklung und Implementierung von erweiterten Analyseanwendungen bereitstellt. Daten werden in IBM Cloud Object Storage (COS) gespeichert. Der Analytics-Engine-Service startet Cluster von Rechenknoten bei Bedarf. Analytics Engine HDFS war bisher unter der Bezeichnung IBM BigInsights on Cloud bekannt.

Verbindung zu IBM Analytics Engine erstellen

Um das Verbindungsasset zu erstellen, benötigen Sie folgende Verbindungsdetails:

  • WebHDFS-URL: Erforderlich.
  • Benutzername. Erforderlich.
  • Kennwort
  • SSL-Zertifikat bei Bedarf durch den Apache-Hive-Server

Wählen Sie Ausgangsverzeichnis als Stammverzeichnis verwenden aus, um das Ausgangsverzeichnis des Benutzernamens für das Stammverzeichnis zum Durchsuchen zu verwenden.

Für private Konnektivität müssen Sie eine sichere Verbindung einrichten, um eine Verbindung zu einer Datenbank herstellen zu können, die nicht über das Internet zugänglich ist (z. B. hinter einer Firewall).

Hive-Eigenschaften
Die Hive-Eigenschaften sind nur für die Verwendung der Analytics Engine HDFS-Verbindung für Zieldaten (Schreibvorgänge) bestimmt. Wenn Sie Hive-Eigenschaften angeben und eine Datei in das Ziel-HDFS schreiben, wird eine Hive-Verbindung hergestellt, die eine Hive-Tabelle für die zugehörige Datei erstellt. Wenn Sie die Hive-Tabellen von Analytics Engine durchsuchen möchten, verwenden Sie die Apache Hive-Verbindung.

  • Hive-Host: Der Hostname oder die IP-Adresse des Apache Hive-Servers.
  • Hive-Datenbank: Die Datenbank in Apache Hive.
  • Hive-Portnummer: Die Port-Nummer des Apache-Hive-Servers. Der Standardwert ist 10000.
  • Hive-HTTP-Pfad: Der Pfad des Endpunkts wie z. B. gateway/default/hive, wenn der Apache Hive-Server für den HTTP-Transportmodus konfiguriert ist.
  • Hive-Benutzer
  • Hive-Kennwort

Methode zum Erstellen einer Verbindung je nach Position in der Plattform auswählen

In einem Projekt Klicken Sie auf Neues Asset > Verbindung. Weitere Informationen finden Sie unter Verbindung zu einem Projekt hinzufügen.


In einem Katalog Klicken Sie auf Zum Katalog hinzufügen > Verbindung. Weitere Informationen finden Sie unter [Verbindungsasset zu einem Katalog hinzufügen] (../catalog/c-add-conn.html).


In einem Bereitstellungsbereich Klicken Sie auf Zu Bereich hinzufügen > Verbindung. Weitere Informationen finden Sie unter Datenassets zu einem Bereitstellungsbereich hinzufügen.


Im Katalog der Plattformassets Klicken Sie auf Neue Verbindung. Weitere Informationen finden Sie unter Plattformverbindungen hinzufügen.

Nächster Schritt: Fügen Sie Datenassets aus der Verbindung hinzu

Wo Sie diese Verbindung verwenden können

Sie können die HDFS-Verbindungen von Analytics Engine in den folgenden Arbeitsbereichen und Tools verwenden:

Projekte

  • Data Refinery (Watson Studio oder Watson Knowledge Catalog)
  • Metadatenimport (Watson Knowledge Catalog)
  • SPSS Modeler (Watson Studio)

Kataloge

  • Katalog der Plattformassets
  • Sonstige Kataloge (Watson Knowledge Catalog)

Analytics Engine-Einrichtung

Einführendes Lernprogramm

Unterstützte Dateitypen

Die Analytics Engine HDFS-Verbindung unterstützt die folgenden Dateitypen: Avro, CSV, Text mit Trennzeichen, Excel, JSON, ORC, Parquet, SAS, SAV, SHP und XML.

Weitere Informationen

Übergeordnetes Thema: Unterstützte Verbindungen