7. [Code Repositories] 데이터 기대치 구성9 - 핵심 요약

본 번역은 검증되지 않았습니다. AIP를 통해 영문원문으로부터 번역되었습니다.

9 - 핵심 요약

이 내용은 learn.palantir.com ↗에서도 확인할 수 있으며 접근성을 위해 여기에 제공됩니다.

데이터 기대치를 파이프라인 관리 실습에 추가하면 상세한 건강 검사와 다운스트림 리소스로의 예기치 않은 데이터 전파를 방지할 수 있는 능력을 얻을 수 있습니다. 그리고 이러한 검사는 Git 기반 저장소에 정의되어 있으므로 일반적인 데이터 건강 검사보다 더 엄격한 변경 관리가 적용됩니다.

이 튜토리얼에서 다음을 수행했습니다:

  1. flight_alerts_clean 데이터 변환에 기본 키 검사를 추가했습니다.
  2. flight_alerts_clean 변환 코드에 열 기대치 (is_in)를 추가했습니다.
  3. flight_alerts_joined_passengers 변환 코드에 그룹화 기대치 (is_unique)를 추가했습니다.
  4. flight_alerts_by_country 변환 생성기 코드에 스키마 기대치 검사를 추가했습니다.

아래는 이 교육 과정에서 사용한 제품 문서 목록입니다:

다음 튜토리얼에서는 Foundry 온톨로지를 소개하고 온톨로지가 가능하게 하는 운영 워크플로를 지원하기 위한 최적의 데이터셋 생성 과정을 안내합니다.