0 / 0
Go back to the English version of the documentation
připojení Apache HDFS
Last updated: 19. 6. 2023
připojení Apache HDFS

Chcete-li přistupovat ke svým datům v Apache HDFS, vytvořte pro něj aktivum připojení.

Apache Hadoop Distributed File System (HDFS) je distribuovaný systém souborů, který je navržen ke spuštění na hardwaru komodit. Apache HDFS byl dříve Hortonworks HDFS.

Vytvořte připojení k serveru Apache HDFS

Chcete-li vytvořit aktivum připojení, budete potřebovat tyto podrobnosti o připojení. Adresa URL WebHDFS je povinná.
Dostupné vlastnosti ve formuláři pro připojení závisí na tom, zda jste vybrali volbu Připojit k Apache Hive , abyste mohli zapisovat tabulky do zdroje dat Hive .

  • Adresa URL WebHDFS pro přístup k systému HDFS.
  • Hostitel Hive : Název hostitele nebo adresa IP serveru Apache Hive .
  • Databáze Hive : The database in Apache Hive.
  • Číslo portu Hive : Číslo portu serveru Apache Hive . Výchozí hodnota je 10000.
  • Hive Cesta HTTP: Cesta koncového bodu, jako např. brány/výchozí/úl, je-li server konfigurován pro režim transportu HTTP.
  • Certifikát SSL (je-li požadován serverem Apache Hive ).

Pověření

Jméno uživatele je povinné.

  • Jméno uživatele a heslo
  • Hive user and password if you connect to Apache Hive .

Chcete-li se připojit k databázi, která není externalizována do Internetu (například za bránou firewall), musíte nastavit zabezpečené připojenípro Privátní připojení.

Zvolte způsob vytvoření připojení založeného na tom, kde jste na platformě.

V projektu
Klepněte na Aktiva > Nové aktivum > Nástroje pro přístup k datům > Připojení. Viz Přidání připojení k projektu.
V katalogu
Klepněte na volbu Přidat do katalogu > Připojení. Viz Přidání aktiva připojení do katalogu.
V prostoru implementace
Klepněte na volbu Přidat do prostoru > Připojení. Viz téma Přidání připojení k prostoru implementace.
V Platform assets catalog
Klepněte na volbu Nové připojení. Viz Přidání připojení platformy.

Další krok: Přidání datových aktiv z připojení

Kde můžete použít toto připojení

Připojení Apache HDFS můžete použít v následujících pracovních prostorech a nástrojích:

Projekty

  • Pravidla kvality dat (Watson Knowledge Catalog)
  • Data Refinery (Watson Studio nebo Watson Knowledge Catalog)
  • DataStage (službaDataStage ). Viz Připojení ke zdroji dat v produktu DataStage.
  • obohacení metadat (Watson Knowledge Catalog)
  • Metadata import (Watson Knowledge Catalog)
  • SPSS Modeler (Watson Studio)

Katalogy

  • Platform assets catalog

  • Další katalogy (Watson Knowledge Catalog)

Nastavení Apache HDFS

Instalace a nastavení klastru Hadoop

Podporované typy souborů

Připojení Apache HDFS podporuje tyto typy souborů: Avro, CSV, Delimited text, Excel, JSON, ORC, Parquet, SAS, SAV, SHP, and XML.

Další informace

PříručkaApache HDFS Users Guide

Nadřízené téma: Podporovaná připojení

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more