이 내용은 learn.palantir.com ↗에서도 사용할 수 있으며 접근성 목적으로 여기에 제공됩니다.
Transform 프로젝트는 일반적으로 소스를 결합하고 추가 비즈니스 로직을 적용하여 풍부한 데이터셋을 생성합니다. 일반적으로 이 데이터셋은 온톨로지 프로젝트 단계에서처럼 일반 노출을 위한 것은 아닙니다. 이 작업에서는 항공편 경보와 승객 데이터소스 프로젝트의 세 가지 깨끗한 결과물 데이터셋을 간단히 결합합니다. 이는 /transformed
코드 폴더에서 진행할 "사전 작업" 유형입니다.
먼저 약 2.5천 행의 항공편 경보 데이터셋을 사용합니다. 승객 데이터(약 1만 행)와 결합하려면 먼저 항공편 경보와 승객 테이블의 기본 키를 포함하는 passenger_flight_alert_clean
결합 테이블(약 13.2만 행)을 사용해야 합니다.
이전 연습에서 생성한 /transformed
폴더를 엽니다.
Pipeline builder에서 passengers_flight_alerts_transformed
라는 새로운 배치 파이프라인을 생성합니다.
이러닝 경로에서 생성한 다음 깨끗한 데이터셋을 추가합니다:
flight_alerts_clean
passengers_clean
passenger_flight_alert_clean
alert_display_name
에서 passenger_flight_alert_clean
을 왼쪽 결합하여 flight_alerts_clean
에 변환을 추가합니다.
변환 작업의 이름을 Alerts to Join Table
로 지정합니다.
passenger_id
를 공유 키로 사용하여 Alerts to Join Table
변환 작업을 passengers_clean
에 결합하는 새로운 변환 작업 Alerts to Passengers
를 생성합니다.
파이프라인을 저장합니다.