Microsoft Azure Data Lake Storage의 데이터에 액세스하려면 이에 대한 연결 자산을 작성하십시오.
Azure ADLS (Data Lake Storage) 는 Microsoft의 퍼블릭 클라우드인 Azure에서 호스팅되는 확장 가능한 데이터 스토리지 및 분석 서비스입니다. Microsoft Azure Data Lake Storage 연결은 Gen1 및 Gen2 Azure Data Lake Storage 저장소 모두에 대한 액세스를 지원합니다.
Microsoft Azure Data Lake Storage 에 대한 연결 작성
연결 자산을 작성하려면 다음 연결 세부사항이 필요합니다.
Microsoft Entra ID는 클라우드 기반 ID 및 액세스 관리 서비스입니다. Entra ID 인증 방법에 대한 연결 값을 얻으려면 Microsoft Azure 포털에 로그인하고 스토리지 계정으로 이동합니다. Microsoft Entra ID에 대한 자세한 내용은 Microsoft Entra ID란 무엇인가요? 를 참조하세요.
Entra ID 클라이언트 시크릿 신임 정보
- 테넌트 ID: Microsoft Entra 테넌트 ID입니다. 테넌트 ID를 찾으려면 마이크로소프트 엔트라 ID> 속성으로 이동합니다. 테넌트 ID 필드까지 아래로 스크롤합니다. 자세한 내용은 Microsoft Entra 테넌트 ID를 찾는 방법를 참조하세요.
- 클라이언트 ID: Microsoft Azure Data Lake Storage에 대한 액세스 권한 부여를 위한 클라이언트 ID입니다. 애플리케이션의 클라이언트 ID를 찾으려면 Microsoft Entra ID를 선택합니다. 앱 등록에서 애플리케이션을 선택합니다. 복사를 클릭하여 애플리케이션의 클라이언트 ID를 복사합니다. 자세한 내용은 Microsoft Entra 앱을 등록하고 서비스 주체를 만들기를 참조하세요.
- 클라이언트 암호: 클라이언트 ID와 연결된 인증 키로 Microsoft Azure Data Lake Storage에 대한 액세스 권한 부여를 위한 인증 키입니다. 애플리케이션의 클라이언트 암호를 찾으려면 마이크로소프트 엔트라 ID를 선택하세요. 앱 등록에서 애플리케이션을 선택합니다. 인증서 & 비밀번호 > 클라이언트 비밀번호로 이동합니다. 복사를 클릭하여 기존 클라이언트 비밀번호를 복사하거나 새 클라이언트 비밀번호를 클릭하여 새 클라이언트 비밀번호를 만든 후 복사합니다. 자세한 내용은 Microsoft Entra 앱 등록 및 서비스 주체 만들기를 참조하세요.
- 저장소 계정 URL: 저장소 계정 URL입니다.
Entra ID 사용자 이름 비밀번호 신임 정보
- 클라이언트 ID: Microsoft Azure Data Lake Storage에 대한 액세스 권한을 부여하기 위한 클라이언트 ID입니다. 애플리케이션의 클라이언트 ID를 찾으려면 Microsoft Entra ID를 선택합니다. 앱 등록에서 애플리케이션을 선택합니다. 복사를 클릭하여 애플리케이션의 클라이언트 ID를 복사합니다. 자세한 내용은 Microsoft Entra 앱을 등록하고 서비스 주체를 만들기를 참조하세요.
- 사용자 이름 및 비밀번호: Microsoft Azure Data Lake Storage 계정의 사용자 이름 및 비밀번호입니다. 멀티팩터 인증 없이 파일에 액세스하려면 권한이 필요합니다.
- 저장소 계정 URL: 저장소 계정 URL입니다.
- WebHDFS URL: HDFS에 액세스하기 위한 WebHDFS URL.
2세대 ADLS에 연결하려면https://<account-name>.dfs.core.windows.net/<file-system>
형식을 사용하십시오. 여기서<account-name>
은 ADLS 인스턴스를 작성할 때 사용한 이름입니다.<file-system>
의 경우, 작성한 컨테이너의 이름을 사용하십시오. 자세한 내용은 Microsoft Data Lake Storage Gen2 문서를 참조하세요.
' - 테넌트 ID: Azure Active Directory 테넌트 ID
- 클라이언트 ID: Microsoft Azure Data Lake Storage 에 대한 액세스 권한을 부여하기 위한 클라이언트 ID
- 클라이언트 시크릿: Microsoft Azure Data Lake Storage 에 대한 액세스 권한을 부여하기 위해 클라이언트 ID와 연관된 인증 키입니다.
서버 프록시 를 선택하여 프록시 서버를 통해 Azure Data Lake Storage 데이터 소스에 액세스하십시오. 설정에 따라 프록시 서버는 로드 밸런싱, 보안 강화 및 개인정보 보호정책을 제공할 수 있습니다. 프록시 서버 설정은 인증 신임 정보 및 개인 또는 공유 신임 정보 선택과 무관합니다.
- 프록시 호스트: 프록시 URL입니다. 예를 들어,
https://proxy.example.com
입니다. - 프록시 포트 번호: 프록시 서버에 연결할 포트 번호입니다. 예를 들어,
8080
또는8443
입니다. - HTTP 또는 HTTPS에 대한 프록시 프로토콜 선택은 선택사항입니다.
개인 연결의 경우 인터넷에 외부화되지 않은 데이터베이스(예: 방화벽 뒤)에 연결하려면 보안 연결을 설정해야 합니다.
플랫폼에 있는 위치를 기반으로 연결을 작성하는 방법 선택
- 프로젝트에서
- 자산 > 새 자산 > 데이터 소스에 연결을 클릭하십시오. 프로젝트에 연결 추가를 참조하십시오.
- 카탈로그에서
- 카탈로그에 추가 > 연결을 클릭하십시오. 카탈로그에 연결 자산 추가를 참조하십시오.
- 배치 영역에서
- 자산 가져오기 > 데이터 액세스 > 연결을 클릭하십시오. 배치 영역에 데이터 자산 추가를 참조하십시오.
- 플랫폼 자산 카탈로그에서
- 새 연결을 클릭하십시오. 플랫폼 연결 추가를 참조하십시오.
다음 단계: 연결에서 데이터 자산 추가
프로젝트에 있는 연결에서 데이터 추가를 참조하십시오.
카탈로그에 있는 연결에서 데이터 추가를 참조하십시오.
이 연결의 사용처
다음 작업공간 및 도구에서 Microsoft Azure Data Lake Storage 연결을 사용할 수 있습니다.
프로젝트
- 데이터 품질 규칙(IBM Knowledge Catalog)
- DataStage (DataStage 서비스). DataStage의 데이터 소스에 연결을 참조하십시오.
- Decision Optimizationwatsonx.ai 스튜디오 및 watsonx.ai 런타임)
- 메타데이터 강화(IBM Knowledge Catalog)
- Metadata import (IBM Knowledge Catalog)
- SPSS Modeler (watsonx.ai Studio)
Catalogs
Platform assets catalog
기타 카탈로그(IBM Knowledge Catalog)
Azure Data Lake Storage 인증 설정
인증을 설정하려면 테넌트 ID, 클라이언트(또는 애플리케이션) ID 및 클라이언트 시크릿이 필요합니다.
- Gen1:
- Azure Active Directory(Azure AD) 웹 애플리케이션을 작성하고 애플리케이션 ID, 인증 키 및 테넌트 ID를 가져오십시오.
- 그런 다음 Azure AD 애플리케이션을 Azure Data Lake Storage 계정 파일 또는 폴더에 지정해야 합니다. Azure Active Directory 사용하여 Azure Data Lake Storage를 사용한 서비스 간 인증의 1, 2, 3단계를 따르세요.
- Gen2:
- 클라이언트 애플리케이션의 요청을 승인하려면 Azure AD에서 토큰 획득의 지침을 따르세요. 이러한 단계들은 새로운 아이덴티티를 작성합니다. ID를 작성한 후에는 ADLS에 애플리케이션 액세스 권한을 부여하는 권한을 설정합니다. Microsoft Azure Data Lake Storage 연결은 애플리케이션에 대해 연관된 클라이언트 ID, 클라이언트 시크릿 및 테넌트 ID를 사용합니다.
- 스토리지 탐색기를 사용하여 스토리지 컨테이너에 대한 Azure 앱 액세스를 제공합니다. 지침은 Azure Storage Explorer를 사용하여 Azure Data Lake Storage Gen2 디렉터리 및 파일 관리를 참조하세요.
지원되는 파일 유형
Microsoft Azure Data Lake Storage 연결은 Avro, CSV, 구분된 텍스트, Excel, JSON, ORC, Parquet, SAS, SAV, SHP및 XML 파일 유형을 지원합니다.
테이블 형식
플랫 파일 외에도 Microsoft Azure Data Lake Storage 연결은 다음과 같은 Data Lake 테이블 형식을 지원합니다. Delta Lake및 Iceberg.
자세한 정보
상위 주제: 지원되는 연결