8. [Pipeline Builder] 온톨로지 데이터 파이프라인9 - 백킹 데이터셋 확인하기

본 번역은 검증되지 않았습니다. AIP를 통해 영문원문으로부터 번역되었습니다.

9 - 백킹 데이터셋 확인하기

이 콘텐츠는 learn.palantir.com ↗에서도 사용할 수 있으며 접근성 목적으로 여기에 제시되어 있습니다.

📖 작업 소개

항공편 경보와 승객 두 개의 오브젝트 유형을 생성하고 연결하려고 합니다. 이를 통해 분석가가 액션을 취하고, 영향을 받는 승객에게 연락하는 것을 포함하여 경보 수신함 애플리케이션을 만들고자 합니다. 이 목표를 염두에 두고, 데이터 파이프라인을 검토하여 모범 사례와 비교하고 항공편 경보와 승객 데이터셋을 온톨로지 오브젝트 유형을 지원하기 위해 추가로 준비할 수 있는 방안을 판단합시다.

🔨 작업 지시사항

  1. 개인 /Temporary Training Artifacts/${yourName} 폴더로 이동하세요.
  2. /Data Engineering Tutorials 폴더에서 오른쪽 클릭하고 팝업 메뉴에서 Data Lineage 탐색을 선택하세요.

이 파이프라인에서는 원하는 결과를 감안할 때 온톨로지 오브젝트를 생성하기 위한 두 개의 후보 데이터셋이 있습니다:

  • passengers_clean
  • flight_alerts_clean

온톨로지 모델을 고려할 때 바로 떠오르는 질문 중 하나는 항공편 경보에 집계된 승객 데이터를 포함할지, 아니면 설정된 온톨로지 링크 유형을 통해 항공편 경보에서 승객 데이터에 액세스할지 여부입니다.

데이터가 단일 정보가 아닌 집계 정보인 경우 경보와 승객 정보를 결합할 수 있습니다. 이 경우 경보와 승객 사이에 일대다 관계가 있기 때문에 경보당 승객 데이터가 집계됩니다. 또한 승객 데이터는 항공편 경보에 대한 주요 보조 정보가 아닙니다. 개념적으로 승객과 항공편 경보는 매우 다른 개체이며 검색 시맨틱스와 유즈케이스가 매우 다릅니다.

이러한 이유로, 백킹 데이터셋 간에 공유된 키를 통해 가능한 링크로 연결된 별개의 오브젝트 유형으로 모델링합시다.