이 내용은 learn.palantir.com ↗에서도 이용할 수 있으며, 접근성을 위해 이곳에도 제공됩니다.
두 개의 데이터소스 프로젝트와 하나의 변환 프로젝트에 대해 구성된 세 개의 별도 일정을 가진 다단계 파이프라인이 있습니다. 이 모든 것들을 Data Lineage 그래프로 가져와서 그들의 논리를 시각화해봅시다.
Alert Metrics Pipeline Data Lineage 그래프를 엽니다.
왼쪽에 있는 모든 "clean" 노드를 선택하여 조상 데이터셋을 모두 확장하고, 오른쪽 클릭하여 **Expand nodes...**를 선택합니다. 그런 다음 Expand parents 창에서 <<
를 클릭합니다.
원하는 대로 노드를 배치합니다.
화면 오른쪽에 있는 일정 관리하기 버튼을 클릭합니다.
각 일정 위로 마우스를 가져다 대어 세 일정 간의 입력/출력 관계를 빠르게 시각화합니다.
노드 색상 옵션을 일정 수로 변경합니다. 그래프에는 노드 당 하나의 일정만 있어야 합니다. 만약 어떤 노드가 여러 일정에 속한다면, 이 색상 옵션을 통해 그것을 밝혀낼 수 있습니다(그리고 이후에 수정해야 합니다).
노드 색상 옵션을 out-of-date로 변경합니다. 파이프라인을 구축하는 방식 때문에, 가장 위쪽의 데이터셋이 업데이트되면 실제로 수정될 것인 데이터셋의 최근성이 고르지 않다는 것을 알게 될 것입니다.
다른 노드 색상 옵션을 몇 가지 시도해 보세요, 이에는 다음이 포함됩니다: