이 내용은 learn.palantir.com ↗에서도 사용할 수 있으며 접근성을 위해 여기에 제공됩니다.
Data Lineage 애플리케이션을 사용하면 전체 데이터 파이프라인을 보기 위해 확대 축소할 수 있습니다. 이 작업에서는 passengers_clean 표가 파생된 방법을 확인하고 "조상"을 탐색합니다. 각 라인(화살표)은 클리닝 단계, 여러 표에서 정보를 결합하는 단계, 표에 새로운 파생 열을 추가하는 단계 등의 데이터 변환을 나타냅니다.
전체 데이터 파이프라인을 볼 수 있도록 확대 축소합니다. 왼쪽 끝에 있는 source/passengers_json_raw라는 보라색 노드와 그 왼쪽에 있는 raw/passengers_json_raw라는 노드를 볼 수 있습니다. 각각은 Foundry로 가져온 원시 json이며 아직 탭 형식의 데이터가 아닙니다.
그래프에서 passengers_preprocessed
라는 노드를 클릭합니다. 이것은 원시 json 데이터셋에 대한 변환으로부터 파생된 탭 형식의 데이터입니다. 몇 번의 클릭으로 내용을 탐색할 수 있습니다.
그래프 하단에 위치한 미리보기 탭을 클릭합니다. 미리보기 탭은 선택한 데이터셋의 스냅샷을 표 형식으로 보여 주며, 표에서 처음 300개 행을 미리 볼 수 있습니다. 데이터가 예상대로 보이는지 확인하기 위해 미리보기를 사용할 수 있습니다.
참고: 이 데이터셋의 이름 데이터는 가공된 것입니다.