0 / 0
Go back to the English version of the documentation
Połączenie Apache HDFS
Last updated: 23 cze 2023
Połączenie Apache HDFS

Aby uzyskać dostęp do danych w systemie Apache HDFS, utwórz dla niego zasób połączenia.

Apache Hadoop Distributed File System (HDFS) to rozproszony system plików, który został zaprojektowany do uruchamiania na sprzęcie towarowym. Apache HDFS to poprzednio Hortonworks HDFS.

Utwórz połączenie z serwerem Apache HDFS

Aby utworzyć zasób połączenia, należy podać te szczegóły połączenia. Adres URL WebHDFS jest wymagany.
Dostępne właściwości w formularzu połączenia zależą od tego, czy wybrano opcję Połącz z serwerem Apache Hive , aby można było zapisywać tabele w źródle danych Hive .

  • Adres URL WebHDFS do uzyskania dostępu do HDFS.
  • Host Hive : nazwa hosta lub adres IP serwera Apache Hive .
  • Baza danych Hive : baza danych w Apache Hive.
  • Numer portu Hive : numer portu serwera Apache Hive . Wartością domyślną jest 10000.
  • Hive Ścieżka HTTP: Ścieżka punktu końcowego, taka jak gateway/default/hive, gdy serwer jest skonfigurowany dla trybu transportu HTTP.
  • Certyfikat SSL (jeśli jest wymagany przez serwer Apache Hive ).

Dane uwierzytelniające

Nazwa użytkownika jest wymagana.

  • Nazwa użytkownika i hasło
  • Hive -użytkownik i hasło, jeśli nawiązano połączenie z serwerem Apache Hive

W przypadku opcji Połączenia prywatnew celu nawiązania połączenia z bazą danych, która nie jest eksternalizowana do Internetu (na przykład za firewallem), należy skonfigurować bezpieczne połączenie.

Wybierz metodę tworzenia połączenia na podstawie miejsca, w którym użytkownik znajduje się na platformie

W projekcie
Kliknij opcję Zasoby > Nowy zasób > Narzędzia dostępu do danych > Połączenie. Więcej informacji na ten temat zawiera sekcja Dodawanie połączenia z projektem.
W katalogu
Kliknij opcję Dodaj do katalogu > Połączenie. Więcej informacji na ten temat zawiera sekcja Dodawanie zasobu połączenia do katalogu.
W obszarze wdrażania
Kliknij opcję Dodaj do obszaru > Połączenie. Więcej informacji na ten temat zawiera sekcja Dodawanie połączeń do miejsca wdrażania.
W Platform assets catalog
Kliknij opcję Nowe połączenie. Patrz sekcja Dodawanie połączeń platformy.

Następny krok: dodawanie zasobów danych z połączenia

Miejsce, w którym można korzystać z tego połączenia

Połączeń Apache HDFS można używać w następujących obszarach roboczych i narzędziach:

Projekty

  • Reguły dotyczące jakości danych (Watson Knowledge Catalog)
  • Data Refinery (Watson Studio lub Watson Knowledge Catalog)
  • DataStage (usługaDataStage ). Więcej informacji na ten temat zawiera sekcja Nawiązywanie połączenia ze źródłem danych w DataStage.
  • Wzbogacanie metadanych (Watson Knowledge Catalog)
  • Metadata import (Watson Knowledge Catalog)
  • SPSS Modeler (Watson Studio)

Katalogi

  • Platform assets catalog

  • Inne katalogi (Watson Knowledge Catalog)

Konfiguracja Apache HDFS

Zainstaluj i skonfiguruj klaster Hadoop

Obsługiwane typy plików:

Połączenie Apache HDFS obsługuje następujące typy plików: Avro, CSV, Delimited text, Excel, JSON, ORC, Parquet, SAS, SAV, SHP i XML.

Więcej inform.

Apache HDFS -Podręcznik użytkownika

Temat nadrzędny: Obsługiwane połączenia

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more