0 / 0
영어 버전 문서로 돌아가기
OpenLineage 연결
마지막 업데이트 날짜: 2024년 12월 13일
OpenLineage 연결

OpenLineage, 데이터에 액세스하려면 해당 데이터에 대한 연결 에셋을 생성합니다.

OpenLineage 데이터 계보를 수집하고 분석하는 데 사용할 수 있는 개방형 프레임워크입니다.

OpenLineage 연결 만들기

연결 자산을 만들려면 다음과 같은 연결 세부 정보가 필요합니다:

  • 호스트 이름 또는 IP 주소
  • 포트 번호

플랫폼에 있는 위치를 기반으로 연결을 작성하는 방법 선택

프로젝트에서
자산 > 새 자산 > 데이터 소스에 연결을 클릭합니다. 프로젝트에 연결 추가를 참조하십시오.

카탈로그에서
카탈로그에 추가 > 연결을 클릭하십시오. 카탈로그에 연결 자산 추가를 참조하십시오.

플랫폼 자산 카탈로그에서
새 연결을 클릭하십시오. 플랫폼 연결 추가를 참조하십시오.

다음 단계: 연결에서 데이터 자산 추가

이 연결의 사용처

다음 작업 공간 및 도구에서 OpenLineage 연결을 사용할 수 있습니다:

프로젝트

  • Metadata import (IBM Knowledge Catalog)

Catalogs

  • Platform assets catalog
  • 기타 카탈로그IBM Knowledge Catalog

데이터 계보

  • Metadata import (lineage)IBM Knowledge Catalog 및 IBM Manta Data Lineage)

OpenLineage 리니지 메타데이터 가져오기 구성하기

OpenLineage 연결에 대한 메타데이터 가져오기를 생성할 때 이 데이터 소스에 특정한 옵션을 설정하고 계보가 생성되는 데이터의 범위를 정의할 수 있습니다. 메타데이터 가져오기에 대한 자세한 내용은 메타데이터 가져오기 디자인을 참조하세요.

OpenLineage, 계보 메타데이터를 가져오려면 다음 단계를 완료하세요:

  1. 데이터 소스 정의를 만듭니다. 데이터 소스 유형으로 OpenLineage 선택합니다.
  2. 프로젝트에서 데이터 소스에 대한 연결을 만듭니다.
  3. 메타데이터 가져오기를 만듭니다. OpenLineage 데이터 소스 전용 옵션에 대해 자세히 알아보세요:
    • 범위를 정의할 때 전체 데이터 소스를 분석하거나 포함 및 제외 옵션을 사용하여 분석하려는 정확한 작업 네임스페이스를 정의할 수 있습니다. 목록 포함 및 제외를 참조하세요.
    • 선택적으로 외부 입력을 제공할 수 있습니다. 파일에서 입력 추가 필드에 이 파일을 추가합니다. 파일은 지원되는 구조를 가져야 합니다. 외부 입력을 참조하세요.

목록 포함 및 제외

OpenLineage 이벤트에서 작업 네임스페이스를 사용하여 에셋을 포함하거나 제외할 수 있습니다. 전체 입력이 정규식으로 평가됩니다. 예제 값:

  • myPrestoApp1Namespace: 작업 네임스페이스가 있는 모든 이벤트 ' myPrestoApp1Namespace.
  • mySparkApp[1-5]Namespace: 작업 네임스페이스가 ' mySparkApp1Namespace '로 시작하고 1에서 5 사이의 숫자로 끝나는 모든 이벤트입니다.

외부 입력

OpenLineage 이벤트를 외부 입력으로 추가할 수 있습니다. 파일은 다음과 같은 구조를 가질 수 있습니다:

<event_file_name>.json

상위 주제: 지원되는 연결

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기