Translation not up to date
Aby uzyskać dostęp do danych w systemie Apache HDFS, utwórz dla niego zasób połączenia.
Apache Hadoop Distributed File System (HDFS) to rozproszony system plików, który został zaprojektowany do uruchamiania na sprzęcie towarowym. Apache HDFS to poprzednio Hortonworks HDFS.
Utwórz połączenie z serwerem Apache HDFS
Aby utworzyć zasób połączenia, należy podać te szczegóły połączenia. Adres URL WebHDFS jest wymagany.
Dostępne właściwości w formularzu połączenia zależą od tego, czy wybrano opcję Połącz z serwerem Apache Hive , aby można było zapisywać tabele w źródle danych Hive .
- Adres URL WebHDFS do uzyskania dostępu do HDFS.
- Host Hive : nazwa hosta lub adres IP serwera Apache Hive .
- Baza danych Hive : baza danych w Apache Hive.
- Numer portu Hive : numer portu serwera Apache Hive . Wartością domyślną jest
10000
. - Hive Ścieżka HTTP: Ścieżka punktu końcowego, taka jak gateway/default/hive, gdy serwer jest skonfigurowany dla trybu transportu HTTP.
- Certyfikat SSL (jeśli jest wymagany przez serwer Apache Hive ).
Dane uwierzytelniające
Nazwa użytkownika jest wymagana.
- Nazwa użytkownika i hasło
- Hive -użytkownik i hasło, jeśli nawiązano połączenie z serwerem Apache Hive
W przypadku opcji Połączenia prywatnew celu nawiązania połączenia z bazą danych, która nie jest eksternalizowana do Internetu (na przykład za firewallem), należy skonfigurować bezpieczne połączenie.
Wybierz metodę tworzenia połączenia na podstawie miejsca, w którym użytkownik znajduje się na platformie
- W projekcie
- Kliknij opcję Zasoby > Nowy zasób > Narzędzia dostępu do danych > Połączenie. Więcej informacji na ten temat zawiera sekcja Dodawanie połączenia z projektem.
- W katalogu
- Kliknij opcję Dodaj do katalogu > Połączenie. Więcej informacji na ten temat zawiera sekcja Dodawanie zasobu połączenia do katalogu.
- W obszarze wdrażania
- Kliknij opcję Dodaj do obszaru > Połączenie. Więcej informacji na ten temat zawiera sekcja Dodawanie połączeń do miejsca wdrażania.
- W Platform assets catalog
- Kliknij opcję Nowe połączenie. Patrz sekcja Dodawanie połączeń platformy.
Następny krok: dodawanie zasobów danych z połączenia
Więcej informacji na ten temat zawiera sekcja Dodawanie danych z połączenia w projekcie.
Więcej informacji na ten temat zawiera sekcja Dodawanie danych z połączenia w katalogu.
Miejsce, w którym można korzystać z tego połączenia
Połączeń Apache HDFS można używać w następujących obszarach roboczych i narzędziach:
Projekty
- Reguły dotyczące jakości danych (Watson Knowledge Catalog)
- Data Refinery (Watson Studio lub Watson Knowledge Catalog)
- DataStage (usługaDataStage ). Więcej informacji na ten temat zawiera sekcja Nawiązywanie połączenia ze źródłem danych w DataStage.
- Wzbogacanie metadanych (Watson Knowledge Catalog)
- Metadata import (Watson Knowledge Catalog)
- SPSS Modeler (Watson Studio)
Katalogi
Platform assets catalog
Inne katalogi (Watson Knowledge Catalog)
Konfiguracja Apache HDFS
Obsługiwane typy plików:
Połączenie Apache HDFS obsługuje następujące typy plików: Avro, CSV, Delimited text, Excel, JSON, ORC, Parquet, SAS, SAV, SHP i XML.
Więcej inform.
Apache HDFS -Podręcznik użytkownika
Temat nadrzędny: Obsługiwane połączenia