7. [Code Repositories] 데이터 기대치 구성5 - 컬럼 기대치: "Is In"

본 번역은 검증되지 않았습니다. AIP를 통해 영문원문으로부터 번역되었습니다.

5 - 컬럼 기대치: "Is In"

이 콘텐츠는 learn.palantir.com ↗에서도 사용할 수 있으며, 접근성 목적으로 여기에 제공됩니다.

📖 작업 소개

비행 경보 데이터에는 사용자가 분석 및 온톨로지 오브젝트 생성을 위해 다운스트림에서 의존하는 priority 컬럼이 있습니다. 이 컬럼은 priority 컬럼 값을 필터링하는 경보 조치 받는 편지함으로 가정해 봅시다. "High," "Medium," "Low" 이외의 값을 파이프라인에 포함하지 않도록 주의를 기울여야 합니다. 기본 키 기대치 검사를 조금 연습한 후에 비행 경보 일정의 결과물flight_alerts_clean에서 is_in 컬럼 기대치 검사를 설정합니다.

🔨 작업 지시 사항

  1. flight_alerts_logic 저장소를 열고 Master에서 새 브랜치를 생성합니다(예: yourName/feature/column_comparison).

  2. priority 컬럼 값이 "High," "Medium," "Low"가 아닌 경우 flight_alerts_clean 작업이 실패하도록 이 데이터 기대치 참조에 있는 is_in 구문을 사용합니다.

  3. 여러 검사를 구조화하는 방법에 대한 안내를 위해 복잡한 검사 문서에 있는 코드 예제를 참고하십시오.

      • 문자열 컬럼 값 주위에 따옴표를 사용하세요(예: “High”).
      • Check는 적어도 세 가지 인수가 필요합니다: (1) 기대치 자체(문서에서 가져올 것); (2) 단일 따옴표로 된 임의의 이름(예: 'My Primary Key Uniqueness Check'); 그리고 (3) 'FAIL' 또는 'WARN'의 on_error 동작.
  4. 코드를 미리 보고 이미지 아래에 나타난 것처럼 미리보기가 완료되면 왼쪽의 기대치 표시기와 Details 링크를 확인합니다.

  5. 브랜치에서 코드를 커밋하고 빌드한 다음 데이터셋의 건강 탭에서 검사를 확인합니다(브랜치에서도 확인 가능).

  6. master로 코드를 병합하고 빌드합니다.