5B. [Code Repositories] 코드 리포지토리에서 공유 라이브러리 게시 및 사용10 - 당신의 데이터셋이 최신인가요?

본 번역은 검증되지 않았습니다. AIP를 통해 영문원문으로부터 번역되었습니다.

10 - 당신의 데이터셋이 최신인가요?

이 내용은 learn.palantir.com ↗에서도 확인할 수 있으며, 접근성을 위해 여기에도 제시되었습니다.

📖 작업 소개

빌드가 얼마나 최신인지 대략적인 감은 있을 수 있지만, 파이프라인의 복잡성이 증가하고 의존성 그래프가 확장됨에 따라 파이프라인의 일부가 나머지에 비해 최신인지 파악하는 것은 어려워질 수 있습니다. 이 작업에서는 빌드에 대한 내용을 잠시 멈추고 Data Lineage 그래프로 이동하여 flight_alerts_logic 저장소에서 빌드된 데이터셋의 최근성을 평가하겠습니다.

🔨 작업 지시사항

  1. flight_alerts_logic 저장소에서 기능 브랜치를 Master에 병합한 후, 저장소 오른쪽 상단의 Explore lineage 버튼을 ctrl+click으로 클릭합니다.

  2. Data Lineage에서 오른쪽 상단의 노드 색상 옵션을 out-of-date로 변경합니다.

  3. out-of-date 노드 색상 범례 하단에서 Data out-of dateLogic out-of-date 옵션을 선택하고 해제하며 색상 차이를 확인합니다. Data Lineage 노드 색상 관련 문서로 이동하여 표에서 out-of-date 항목을 찾아 가능한 값들을 확인합니다.

    이는 파이프라인이 일관되게 최신인지, 빌드 문제를 수정하기 위해 어디를 찾아봐야 하는지 판단하는 데 유용한 노드 색상 옵션입니다. 우리 경우에는 Master 브랜치에 새로 빌드된 것이 없으므로 노드의 데이터는 모두 최신으로 보입니다. 그러나 Master 브랜치에는 새 로직이 있으므로 Logic 상자를 선택하면 새로운 로직과 동기화되지 않은 데이터셋이 드러납니다.

  4. ctrl+a로 그래프 상의 모든 노드를 선택합니다.

  5. 오른쪽에 접혀 있는 사이드 메뉴에서 “hammer” 아이콘(“빌드 관리하기”)을 클릭합니다.

  6. 선택된 데이터셋만을 선택한 후, 파란색 Next (미리보기 보기) 버튼을 클릭합니다.

  7. 화면 하단 오른쪽에 있는 파란색 빌드 실행 버튼을 클릭합니다. 프로세스가 완료되면, 데이터셋(데이터와 Logic)이 그래프에 업데이트된 상태로 나타납니다.