8. [Pipeline Builder] 온톨로지 데이터 파이프라인11 - 온톨로지 데이터 변환

본 번역은 검증되지 않았습니다. AIP를 통해 영문원문으로부터 번역되었습니다.

11 - 온톨로지 데이터 변환

이 내용은 learn.palantir.com ↗에서도 사용할 수 있으며, 접근성을 위해 이곳에도 제시되었습니다.

📖 작업 소개

새 파이프라인 아티팩트에서는 세 개의 입력 데이터셋을 사용하여 온톨로지 오브젝트 유형과 링크 유형을 준비하기 위한 세 가지 결과물을 생성합니다.

  1. flight_alerts_clean: 이것은 우리의 비행 경보 오브젝트 유형을 지원하겠지만, 먼저 예상되는 워크플로에 필요하지 않은 category 열을 제거하려고 합니다(온톨로지 저장 서비스로 동기화할 데이터의 양을 줄이면 계산 부하도 줄어듭니다).
  2. passengers_clean: 이 데이터셋은 현재로서는 업데이트가 필요하지 않다고 판단했으므로, Pipeline Builder를 사용하여 그대로 결과물로 전달하겠습니다.
  3. passenger_flight_alert_clean: 승객과 비행 경보 사이에는 다대다 관계가 있습니다. 관계형 데이터베이스에서의 다대다 조인과 마찬가지로, 온톨로지에서의 다대다 링크 유형을 지원하기 위해 조인 테이블이 필요합니다. 따라서 우리의 파이프라인의 일부인 이 데이터셋도 준비해야 하며(추가 준비가 필요하지 않다고 가정하겠습니다).

🔨 작업 지시사항

  1. 위에서 언급한 세 개의 데이터셋을 가져옵니다.
  2. passengers_cleanpassenger_flight_alert_clean에 대한 결과물 데이터셋을 passengerspassenger_flight_alerts로 만듭니다.
  3. flight_alerts_clean에 대해 category 열을 제거하는 변환을 추가합니다.
  4. 그 비행 경보 변환에서 flight_alerts라는 결과물 데이터셋을 생성합니다.
  5. 파이프라인을 배포합니다.