7. [Repositories] Configuring Data Expectations5 - 行の期待値:「Is In」

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

5 - 列の期待値: “Is In”

この内容は learn.palantir.com ↗ でもご覧いただけますが、アクセシビリティの観点から、ここに掲載しています。

📖 タスクの概要

フライトアラートデータには、分析やオントロジーオブジェクト生成のためにユーザーが下流で依存する priority 列があります。これが priority 列の値でフィルター処理するアラートトリアージインボックスにフィードされると仮定します。"High"、"Medium"、"Low" 以外の値がパイプラインに入らないようにすることが重要です。主キー期待値チェックを少し練習したので、flight_alerts_cleanis_in 列期待値チェックを設定します。これはフライトアラートスケジュールの出力です。

🔨 タスクの説明

  1. flight_alerts_logic リポジトリを開き、Master から新しいブランチを作成します(例: yourName/feature/column_comparison)。

  2. このデータ期待値リファレンスis_in 構文を使用して、priority 列の値が "High"、"Medium"、"Low" でない場合に flight_alerts_clean ジョブが失敗するようにします。

  3. 複数のチェックを構造化する方法については、複雑なチェックのドキュメント のコード例を参照してください。

    • ヒント
      • 文字列列の値の周りに引用符を付ける(例: “High”)
      • Check には少なくとも 3 個の引数が必要です。(1) 期待値そのもの(ドキュメント から引っ張ってくるもの); (2) シングルクォートで囲まれた任意の名前(例: 'My Primary Key Uniqueness Check'); (3) 'FAIL' または 'WARN' の on_error 動作。
  4. コードをプレビューし、プレビューが表示されたら、Preview ヘルパーの左側にある期待値インジケーターと Details リンクに注目してください。

  5. ブランチ上でコードをコミットしてビルドし、データセットのヘルスタブでチェックを確認します(ブランチ上でも)。

  6. コードを master にマージしてビルドします。