이 내용은 learn.palantir.com ↗에서도 사용할 수 있으며, 접근성을 위해 이곳에도 제시되었습니다.
새 파이프라인 아티팩트에서는 세 개의 입력 데이터셋을 사용하여 온톨로지 오브젝트 유형과 링크 유형을 준비하기 위한 세 가지 결과물을 생성합니다.
flight_alerts_clean
: 이것은 우리의 비행 경보 오브젝트 유형을 지원하겠지만, 먼저 예상되는 워크플로에 필요하지 않은 category
열을 제거하려고 합니다(온톨로지 저장 서비스로 동기화할 데이터의 양을 줄이면 계산 부하도 줄어듭니다).passengers_clean
: 이 데이터셋은 현재로서는 업데이트가 필요하지 않다고 판단했으므로, Pipeline Builder를 사용하여 그대로 결과물로 전달하겠습니다.passenger_flight_alert_clean
: 승객과 비행 경보 사이에는 다대다 관계가 있습니다. 관계형 데이터베이스에서의 다대다 조인과 마찬가지로, 온톨로지에서의 다대다 링크 유형을 지원하기 위해 조인 테이블이 필요합니다. 따라서 우리의 파이프라인의 일부인 이 데이터셋도 준비해야 하며(추가 준비가 필요하지 않다고 가정하겠습니다).passengers_clean
과 passenger_flight_alert_clean
에 대한 결과물 데이터셋을 passengers
와 passenger_flight_alerts
로 만듭니다.flight_alerts_clean
에 대해 category
열을 제거하는 변환을 추가합니다.flight_alerts
라는 결과물 데이터셋을 생성합니다.