본 번역은 검증되지 않았습니다. AIP를 통해 영문원문으로부터 번역되었습니다.

Data Lineage 질문

다음은 Data Lineage에 대한 자주 묻는 질문입니다.

일반적인 정보는 Data Lineage 관련 문서를 참조하세요.


Data Lineage에서 오브젝트 유형에 대한 백업 및 writeback 데이터셋을 어떻게 볼 수 있습니까?

  • 먼저, 오른쪽 패널에서 Data Lineage 그래프에 오브젝트를 추가하세요(돋보기 아이콘을 가진 탭). 오브젝트 유형을 검색 필터로 선택한 다음, 백업 및 writeback 데이터셋을 보려는 오브젝트의 이름을 입력하세요.

  • 다음으로, 오브젝트 유형 왼쪽의 화살표를 선택하여 조상을 표시하세요. 오브젝트 유형이 읽기 전용인 경우 조상 노드가 하나, writeback이 활성화된 경우 조상 노드가 두 개 생성되어야 합니다. 노드 색상 옵션 드롭다운에서 리소스 유형을 선택하여 오른쪽 상단 범례에 따라 Writeback 데이터셋의 색상이 표시되도록 합니다. 백업 스키마 데이터셋 색상은 사용된 변환 유형에 따라 달라집니다.

  • 오브젝트 유형에 대한 writeback 및 백업 데이터셋은 오른쪽 상단에 작은 지구 아이콘도 있습니다.

맨 위로 돌아가기


파이프라인의 어떤 데이터셋에 특정 열이 포함되어 있습니까?

  1. 먼저, 파이프라인의 원하는 데이터셋이 모두 Data Lineage 그래프에 추가되었는지 확인하세요.
  2. 다음으로, 도구 토글의 선택 모드를 사용하여 원하는 데이터셋을 선택하세요. 그리고 캔버스 왼쪽 상단에 위치한 토글을 사용합니다.
  3. 그런 다음 오른쪽 패널에서 선택한 속성의 히스토그램을 엽니다. 자주 사용되는 열 섹션에서 선택한 데이터셋의 열 이름별로 가장 빈번한 열을 볼 수 있습니다.

이러한 열 중 하나를 선택하면 해당 열이 포함된 선택한 데이터셋이 강조 표시됩니다.

맨 위로 돌아가기


파이프라인의 이 리소스를 마지막으로 수정한 사람은 누구입니까?

  • 먼저, 파이프라인에서 관심 있는 모든 데이터셋이 Data Lineage 그래프에 추가되었는지 확인하세요.
  • 다음으로, 화면 왼쪽 상단의 도구 토글에서 선택 모드를 사용하여 데이터셋을 선택하세요. 그런 다음 오른쪽 패널에서 선택한 속성의 히스토그램을 엽니다.
  • 마지막 수정 섹션에서 선택한 데이터셋을 마지막으로 수정한 사용자를 볼 수 있습니다. 사용자 이름을 선택하면 그 사용자가 마지막으로 수정한 데이터셋이 그래프에서 강조 표시됩니다.

맨 위로 돌아가기


어떤 데이터셋에 개방된 트랜잭션이 있는지 어떻게 찾을 수 있습니까?

오른쪽 상단의 드롭다운 메뉴에서 빌드 상태를 선택하세요. 이제 데이터셋이 현재 실행 중인지 볼 수 있습니다. 이러한 데이터셋은 개방된 트랜잭션을 가지고 있습니다.

맨 위로 돌아가기


파이프라인에서 사용되는 대부분의 데이터셋이 어디에 저장되어 있습니까?

  • 먼저, 파이프라인에서 관심 있는 모든 데이터셋이 Data Lineage 그래프에 추가되었는지 확인하세요.
  • 다음으로, 화면 왼쪽 상단의 도구 토글에서 선택 모드를 사용하여 관심 있는 모든 데이터셋을 선택하세요. 그런 다음 오른쪽 패널에서 선택한 속성의 히스토그램을 엽니다.
  • 자주 사용되는 폴더 경로 섹션에서 선택한 리소스의 가장 일반적인 폴더 경로를 볼 수 있습니다.

골든 경로를 선택하면 그래프에서 이 경로의 리소스가 강조 표시됩니다. 폴더 경로 위에 마우스를 올리면 전체 경로가 표시됩니다.

선택한 속성의 히스토그램 패널에서 여러 속성을 선택하여 그래프가 선택한 모든 리소스를 강조 표시하도록 할 수 있습니다.

맨 위로 돌아가기


저장되지 않은 Data Lineage 그래프를 어떻게 공유할 수 있습니까?

저장되지 않은 Data Lineage를 공유하려면, 저장하기 근처 오른쪽 상단 화살표를 선택하세요. 거기에서 빠른 공유 링크를 확인할 수 있습니다.

맨 위로 돌아가기


왜 내 데이터셋이 최신 상태가 아닌가요?

데이터셋이 최신 상태가 아닌 몇 가지 이유가 있습니다.

다음 이유를 고려하여 데이터셋이 최신 상태가 아닌지 확인하세요:

  • 데이터셋 빌드가 실패하였습니까?
  • 업스트림 데이터셋이 빌드되지 않았고 최신 상태가 아닙니까?
  • 소스에서 최신 데이터를 받았습니까?

Data Lineage에서 이러한 질문에 쉽게 답할 수 있습니다:

  1. 먼저 파이프라인의 각 리소스 상태를 확인하려면 Data Lineage에서 관심 데이터셋을 열고 노드를 마우스 오른쪽 버튼으로 클릭하세요.

  2. 그런 다음 **노드 확장...**을 선택하세요. Expand parents... 위의 두 개의 왼쪽 화살표를 선택하여 해당 데이터셋에 대한 모든 조상 노드를 볼 수 있습니다.

  3. 다음으로 오른쪽 상단의 노드 색상 옵션 드롭다운 메뉴에서 빌드 상태 옵션을 선택하여 파이프라인의 모든 리소스 빌드 상태를 확인하세요. 이 파이프라인 뷰를 사용하면 오래된 데이터셋을 진단하기가 더 쉬워집니다.

맨 위로 돌아가기