Apache HDFS 연결

마지막 업데이트 날짜: 2025년 4월 02일
Apache HDFS 연결

Apache HDFS의 데이터에 액세스하려면 이에 대한 연결 자산을 작성하십시오.

Apache Hadoop Distributed File System (HDFS) 은 상용 하드웨어에서 실행되도록 설계된 분산 파일 시스템입니다. Apache HDFS는 이전에 Hortonworks HDFS였습니다.

지원되는 버전

Apache HDFS 3.1.

Apache HDFS에 대한 연결 작성

연결 자산을 작성하려면 다음 연결 세부사항이 필요합니다. WebHDFS URL 이 필요합니다.
연결 양식에서 사용 가능한 속성은 Hive 데이터 원본에 테이블을 쓸 수 있도록 Apache Hive 에 연결을 선택하는지 여부에 따라 달라집니다.

  • WebHDFS URL 를 클릭하여 HDFS 에 액세스합니다.
  • Hive 호스트: Apache Hive 서버의 호스트 이름 또는 IP 주소입니다.
  • Hive 데이터베이스: Apache Hive의 데이터베이스.
  • Hive 포트 번호: Apache Hive 서버의 포트 번호. 기본값은 10000입니다.
  • Hive HTTP 경로: 서버가 HTTP 전송 모드로 구성된 경우 게이트웨이/기본값/하이브와 같은 엔드포인트의 경로입니다.
  • SSL 인증서 ( Apache Hive 서버에서 필요한 경우).

개인 연결의 경우 인터넷에 외부화되지 않은 데이터베이스(예: 방화벽 뒤)에 연결하려면 보안 연결을 설정해야 합니다.

플랫폼에 있는 위치를 기반으로 연결을 작성하는 방법 선택

프로젝트에서
자산 > 새 자산 > 데이터 소스에 연결을 클릭하십시오. 프로젝트에 연결 추가를 참조하십시오.
배치 영역에서
자산 가져오기 > 데이터 액세스 > 연결을 클릭하십시오. 배치 영역에 데이터 자산 추가를 참조하십시오.
플랫폼 자산 카탈로그에서
새 연결을 클릭하십시오. 플랫폼 연결 추가를 참조하십시오.

다음 단계: 연결에서 데이터 자산 추가

이 연결의 사용처

다음 작업 공간 및 도구에서 Apache HDFS 연결을 사용할 수 있습니다.

프로젝트

  • Data Refinery
  • Decision Optimization
  • SPSS Modeler
  • Synthetic Data Generator

Catalogs

  • Platform assets catalog

Apache HDFS 설정

Hadoop 클러스터 설치 및 설정

지원되는 파일 유형

Apache HDFS 연결은 Avro, CSV, Delimited text, Excel, JSON, ORC, Parquet, SAS, SAV, SHP 및 XML 파일 유형을 지원합니다.

테이블 형식

Apache HDFS 연결은 플랫 파일 외에도 다음과 같은 데이터 레이크 테이블 형식( Delta Lake 및 Iceberg)을 지원합니다.

자세히 알아보기

Apache HDFS 사용자 안내서

상위 주제: 지원되는 연결