5C. [Code Repositories] 데이터 변환을 통한 다중 출력10 - 파이프라인의 현황 파악

본 번역은 검증되지 않았습니다. AIP를 통해 영문원문으로부터 번역되었습니다.

10 - 파이프라인의 현황 파악

이 내용은 learn.palantir.com ↗에서도 이용할 수 있으며, 접근성을 위해 이곳에도 제공됩니다.

📖 작업 소개

두 개의 데이터소스 프로젝트와 하나의 변환 프로젝트에 대해 구성된 세 개의 별도 일정을 가진 다단계 파이프라인이 있습니다. 이 모든 것들을 Data Lineage 그래프로 가져와서 그들의 논리를 시각화해봅시다.

🔨 작업 지시사항

  1. Alert Metrics Pipeline Data Lineage 그래프를 엽니다.

  2. 왼쪽에 있는 모든 "clean" 노드를 선택하여 조상 데이터셋을 모두 확장하고, 오른쪽 클릭하여 **Expand nodes...**를 선택합니다. 그런 다음 Expand parents 창에서 <<를 클릭합니다.

  3. 원하는 대로 노드를 배치합니다.

  4. 화면 오른쪽에 있는 일정 관리하기 버튼을 클릭합니다.

  5. 각 일정 위로 마우스를 가져다 대어 세 일정 간의 입력/출력 관계를 빠르게 시각화합니다.

  6. 노드 색상 옵션일정 수로 변경합니다. 그래프에는 노드 당 하나의 일정만 있어야 합니다. 만약 어떤 노드가 여러 일정에 속한다면, 이 색상 옵션을 통해 그것을 밝혀낼 수 있습니다(그리고 이후에 수정해야 합니다).

  7. 노드 색상 옵션out-of-date로 변경합니다. 파이프라인을 구축하는 방식 때문에, 가장 위쪽의 데이터셋이 업데이트되면 실제로 수정될 것인 데이터셋의 최근성이 고르지 않다는 것을 알게 될 것입니다.

  8. 다른 노드 색상 옵션을 몇 가지 시도해 보세요, 이에는 다음이 포함됩니다:

    • Repository
    • Folder
    • 마지막으로 빌드된 시간