Apache HDFS 연결
마지막 업데이트 날짜: 2025년 4월 02일
Apache HDFS의 데이터에 액세스하려면 이에 대한 연결 자산을 작성하십시오.
Apache Hadoop Distributed File System (HDFS) 은 상용 하드웨어에서 실행되도록 설계된 분산 파일 시스템입니다. Apache HDFS는 이전에 Hortonworks HDFS였습니다.
지원되는 버전Copy link to section
Copy link to section
Apache HDFS 3.1.
Apache HDFS에 대한 연결 작성Copy link to section
Copy link to section
연결 자산을 작성하려면 다음 연결 세부사항이 필요합니다. WebHDFS URL 이 필요합니다.
연결 양식에서 사용 가능한 속성은 Hive 데이터 원본에 테이블을 쓸 수 있도록 Apache Hive 에 연결을 선택하는지 여부에 따라 달라집니다.
- WebHDFS URL 를 클릭하여 HDFS 에 액세스합니다.
- Hive 호스트: Apache Hive 서버의 호스트 이름 또는 IP 주소입니다.
- Hive 데이터베이스: Apache Hive의 데이터베이스.
- Hive 포트 번호: Apache Hive 서버의 포트 번호. 기본값은
입니다.10000
- Hive HTTP 경로: 서버가 HTTP 전송 모드로 구성된 경우 게이트웨이/기본값/하이브와 같은 엔드포인트의 경로입니다.
- SSL 인증서 ( Apache Hive 서버에서 필요한 경우).
개인 연결의 경우 인터넷에 외부화되지 않은 데이터베이스(예: 방화벽 뒤)에 연결하려면 보안 연결을 설정해야 합니다.
플랫폼에 있는 위치를 기반으로 연결을 작성하는 방법 선택Copy link to section
Copy link to section
- 프로젝트에서
- 자산 > 새 자산 > 데이터 소스에 연결을 클릭하십시오. 프로젝트에 연결 추가를 참조하십시오.
- 배치 영역에서
- 자산 가져오기 > 데이터 액세스 > 연결을 클릭하십시오. 배치 영역에 데이터 자산 추가를 참조하십시오.
- 플랫폼 자산 카탈로그에서
- 새 연결을 클릭하십시오. 플랫폼 연결 추가를 참조하십시오.
다음 단계: 연결에서 데이터 자산 추가Copy link to section
Copy link to section
- 프로젝트에 있는 연결에서 데이터 추가를 참조하십시오.
이 연결의 사용처Copy link to section
Copy link to section
다음 작업 공간 및 도구에서 Apache HDFS 연결을 사용할 수 있습니다.
프로젝트
- Data Refinery
- Decision Optimization
- SPSS Modeler
- Synthetic Data Generator
Catalogs
- Platform assets catalog
Apache HDFS 설정Copy link to section
Copy link to section
지원되는 파일 유형Copy link to section
Copy link to section
Apache HDFS 연결은 Avro, CSV, Delimited text, Excel, JSON, ORC, Parquet, SAS, SAV, SHP 및 XML 파일 유형을 지원합니다.
테이블 형식Copy link to section
Copy link to section
Apache HDFS 연결은 플랫 파일 외에도 다음과 같은 데이터 레이크 테이블 형식( Delta Lake 및 Iceberg)을 지원합니다.
자세히 알아보기Copy link to section
Copy link to section
상위 주제: 지원되는 연결
주제가 도움이 되었습니까?
0/1000