이 내용은 learn.palantir.com ↗에서도 확인할 수 있으며, 접근성을 위해 여기에 제시되었습니다.
왜 Ontology에 입력으로 사용하기 위해 수정하지 않은 데이터셋의 clean
버전을 그냥 사용하지 않았을까요?
Clean
데이터셋은 Foundry에서 많은 활동의 시작점이 되는 경향이 있습니다. 이에는 분석, 모델링, 그리고 기타 데이터 파이프라인이 포함됩니다. 일반적으로 raw
데이터에 가깝게 나타나므로 Ontology 오브젝트와 링크 유형에 필요한 것보다 훨씬 많은 열을 포함할 수 있지만, 이는 다른 워크플로에 있어서는 귀중한 자산입니다. 우리는 결국 Ontology를 지원하는 데이터셋에 새로 파생된 열을 추가하기로 결정할 수도 있고, 이러한 변경 사항을 clean
버전에 영향을 주지 않고 싶을 수 있습니다. 이 중간 변환 단계(clean
→ ontology
)는 초기에 형식적으로 보일지라도 항상 권장됩니다.
지금까지 이 교육 트랙에서 배운 사항에 따라 파이프라인에 변환 단계를 추가하였으므로, 이를 문서화하고, 일정을 설정하고, 모니터링해야 합니다. 이러한 요약 추천사항을 따라가면서 지식을 테스트해 보세요.
/Ontology Project: Flight Alerts/documentation/
에 저장합니다.세 개의 새 ontology 데이터셋 각각에 다음의 건강 검사를 적용하고, 이를 관련 검사 그룹에 추가합니다:
COLUMN_ADDITIONS_ALLOWED_ STRICT
).flight_alerts_passenger
에 대해서는 검사를 수행하여 alert_display_name
와 passenger_id
의 조합을 확인합니다.Ontology에서 오브젝트와 링크 유형을 설정한 후에 마지막 검사를 추가하도록 돌아올 것입니다. 참고로 이 새로운 모든 데이터셋은 자동으로 기존의 Schedule Status와 Schedule Duration 검사에 추가됩니다.