0 / 0
영어 버전 문서로 돌아가기
Apache HDFS 연결
Apache HDFS 연결

Apache HDFS 연결

Apache HDFS의 데이터에 액세스하려면 이에 대한 연결 자산을 작성하십시오.

Apache Hadoop Distributed File System (HDFS) 은 상용 하드웨어에서 실행하도록 설계된 분산 파일 시스템입니다. Apache HDFS는 이전에 Hortonworks HDFS였습니다.

Apache HDFS에 대한 연결 작성

연결 자산을 작성하려면 이러한 연결 세부사항이 필요합니다. WebHDFS URL이 필요하다.

  • HDFS에 액세스하기 위한 WebHDFS URL
  • Hive HTTP 경로: 서버가 HTTP 전송 모드로 구성된 경우 게이트웨이/기본값/하이브와 같은 엔드포인트의 경로입니다.
  • Hive 호스트: Apache Hive 서버의 호스트 이름 또는 IP 주소입니다.
  • Hive 포트 번호: Apache Hive 서버의 포트 번호. 기본값은 10000입니다.
  • Hive 데이터베이스: Apache Hive의 데이터베이스.
  • SSL 인증서 ( Apache Hive 서버에 필요한 경우)

신임 정보

사용자 이름은 필수입니다.

  • 사용자 이름 및 비밀번호
  • Apache Hive 에 연결하기 위한 Hive 사용자 및 암호

개인 연결의 경우 인터넷에 외부화되지 않은 데이터베이스(예: 방화벽 뒤)에 연결하려면 보안 연결을 설정해야 합니다.

플랫폼에 있는 위치를 기반으로 연결을 작성하는 방법 선택

프로젝트에서 자산 > 새 자산 > 데이터 액세스 도구 > 연결을 클릭하십시오. 프로젝트에 연결 추가를 참조하십시오.


카탈로그 카탈로그에 추가 > 연결을 클릭하십시오. 카탈로그에 연결 자산 추가를 참조하십시오.


배치 공간에서 Click 공간에 추가 > 연결. 배치 공간에 연결 추가를 참조하십시오.


Platform assets catalog 에서 Click 새 연결. 플랫폼 연결 추가를 참조하십시오.

다음 단계: 연결에서 데이터 자산 추가

이 연결의 사용처

다음 작업 공간 및 도구에서 Apache HDFS 연결을 사용할 수 있습니다.

프로젝트

  • Data Refinery(Watson Studio 또는 Watson Knowledge Catalog)
  • DataStage (DataStage)
  • Metadata import (Watson Knowledge Catalog)
  • SPSS Modeler (Watson Studio)

카탈로그

  • Platform assets catalog
  • 기타 카탈로그(Watson Knowledge Catalog)

Apache HDFS 설정

Hadoop 및 설정

지원되는 파일 유형

Apache HDFS 연결은 Avro, CSV, Delimited text, Excel, JSON, ORC, Parquet, SAS, SAV, SHP 및 XML 파일 유형을 지원합니다.

자세히 보기

Apache HDFS 사용자 안내서

상위 주제: 지원되는 연결