5. [Pipeline Builder] Transforms 프로젝트10 - 다중 결과물 생성

본 번역은 검증되지 않았습니다. AIP를 통해 영문원문으로부터 번역되었습니다.

10 - 다중 결과물 생성

이 내용은 learn.palantir.com ↗에서도 확인할 수 있으며 접근성을 위해 여기에 제시되었습니다.

📖 작업 소개

분석팀이 각 승객의 출신 국가별로 고유한 flight_alerts_joined_passengers 데이터셋을 생성하도록 요청했다고 가정해봅시다. 이때 개인정보를 제거하는 추가 로직을 적용해야 합니다. 예를 들어, 승객이 멕시코 출신인 모든 행을 flight_alerts_mexico라는 새 데이터셋으로 보내고 그러한 식입니다.

먼저 각 국가에 대해 고유한 변환 필터를 생성한 다음 각각에 대한 결과물 데이터셋을 생성합니다. 여기서는 국가 목록이 시간이 지나도 변경되지 않는다고 가정합니다. 변환에 대해 다중 결과물을 동적으로 생성해야 하는 경우, Code Repositories에서 생성된 변환을 생성하려고 할 것입니다. Code Repositories 애플리케이션에서 다중 출력 방법을 연습하고 싶다면, 이 학습 경로에서 "Repositories" 트랙을 따라가는 것을 고려해 보세요.

🔨 작업 지시사항

  1. 먼저, 데이터셋으로 분류해야 하는 가능한 국가 값은 무엇인가요? Alerts to Passengers 변환을 클릭하고 하단의 미리보기 창에서 country 열을 찾습니다.

  2. country 열에서 버튼을 클릭하고 View stats를 선택합니다. 8개의 고유 값이 있는 것을 확인합니다.

  3. 이 값들 각각에 대해 다음을 수행합니다:

    • Alerts to Passengers 변환에 Country Filter: ${countryName}(예: Country Filter: Canada)이라는 변환을 추가합니다.
    • 각 변환에서 지정된 국가로 필터링하는 country 열에 Filter를 적용합니다.
    • 8개의 모든 변환을 추가한 후 각각에 대해 flight_alerts_${countryName}(예: flight_alerts_canada)라는 제목의 결과물 데이터셋을 생성합니다.

    ℹ️ 위의 항목들을 진행하면서 Copy within pipelinePaste within pipeline 옵션을 이용해 실험해 보세요. 아래의 간단한 애니메이션에서 보여줍니다.

  4. 파이프라인을 배포합니다.