최신 변환이 아님
이 페이지의 변환은 최신 버전을 나타내지 않습니다. 최신 업데이트는 영어 버전 문서를 참조하십시오.
Apache HDFS 연결
마지막 업데이트 날짜: 2025년 5월 08일
생성되었습니다: "2021-04-08 09:36:04 -0400" title: " Apache HDFS 연결" fname: " manage-data\conn-hdfs.liquid.md "
Apache HDFS의 데이터에 액세스하려면 이에 대한 연결 자산을 작성하십시오.
Apache Hadoop Distributed File System (HDFS) 은 상용 하드웨어에서 실행되도록 설계된 분산 파일 시스템입니다. Apache HDFS는 이전에 Hortonworks HDFS였습니다.
지원되는 버전
Apache HDFS 3.1.
Apache HDFS에 대한 연결 작성
연결 자산을 작성하려면 다음 연결 세부사항이 필요합니다. WebHDFS URL 이 필요합니다.
연결 양식에서 사용 가능한 속성은 Hive 데이터 원본에 테이블을 쓸 수 있도록 Apache Hive 에 연결을 선택하는지 여부에 따라 달라집니다.
- WebHDFS URL 를 클릭하여 HDFS 에 액세스합니다.
- Hive 호스트: Apache Hive 서버의 호스트 이름 또는 IP 주소입니다.
- Hive 데이터베이스: Apache Hive의 데이터베이스.
- Hive 포트 번호: Apache Hive 서버의 포트 번호. 기본값은
10000
입니다. - Hive HTTP 경로: 서버가 HTTP 전송 모드로 구성된 경우 게이트웨이/기본값/하이브와 같은 엔드포인트의 경로입니다.
- SSL 인증서 ( Apache Hive 서버에서 필요한 경우).
개인 연결의 경우 인터넷에 외부화되지 않은 데이터베이스(예: 방화벽 뒤)에 연결하려면 보안 연결을 설정해야 합니다.
플랫폼에 있는 위치를 기반으로 연결을 작성하는 방법 선택
- 프로젝트에서
- 자산 > 새 자산 > 데이터 소스에 연결을 클릭하십시오. 프로젝트에 연결 추가를 참조하십시오.
- 배치 영역에서
- 자산 가져오기 > 데이터 액세스 > 연결을 클릭하십시오. 배치 영역에 데이터 자산 추가를 참조하십시오.
- 플랫폼 자산 카탈로그에서
- 새 연결을 클릭하십시오. 플랫폼 연결 추가를 참조하십시오.
다음 단계: 연결에서 데이터 자산 추가
- 프로젝트에 있는 연결에서 데이터 추가를 참조하십시오.
Apache HDFS 설정
지원되는 파일 유형
Apache HDFS 연결은 Avro, CSV, Delimited text, Excel, JSON, ORC, Parquet, SAS, SAV, SHP 및 XML 파일 유형을 지원합니다.
테이블 형식
Apache HDFS 연결은 플랫 파일 외에도 다음과 같은 데이터 레이크 테이블 형식( Delta Lake 및 Iceberg)을 지원합니다.
자세히 알아보기
상위 주제: 지원되는 연결
주제가 도움이 되었습니까?
0/1000