7. [Repositories] データ期待値の設定5 - 行の期待値:「Is In」

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

5 - 行の期待値:「Is In」

📖 タスクの概要

ユーザーのフライトアラートデータには、priority 行があり、これを下流の分析やオントロジーオブジェクト生成で使用します。例えば、priority 行の値でフィルター処理するアラート対応の受信箱にフィードするとしましょう。この場合、"High"、"Medium"、"Low" 以外の値がパイプラインに入らないように注意してください。主キーの期待値チェックの練習ができたので、フライトアラートスケジュールの出力である flight_alerts_cleanis_in 行の期待値チェックを設定します。

🔨 タスクの説明

  1. flight_alerts_logic リポジトリを開き、Master から新しいブランチを作成します(例:yourName/feature/column_comparison)。

  2. このデータ期待値のリファレンスis_in 構文を使用して、priority 行の値が "High"、"Medium"、"Low" でない場合、flight_alerts_clean ジョブが失敗するようにします。

  3. 複数のチェックを構造化する方法については、複雑なチェックのドキュメント のコード例を参照してください。

    • ヒント
      • 文字列行の値に引用符を付けてください(例:"High")
      • Check には、少なくとも3つの引数が必要です:(1) 期待値そのもの(これは ドキュメント から取得します);(2) シングルクオートで囲まれた任意の名前(例:'My Primary Key Uniqueness Check');(3) 'FAIL' または 'WARN' の on_error 挙動。
  4. コードをプレビューし、プレビューが表示されると、下の画像のように プレビュー ヘルパーの左側に期待値インジケータと 詳細 リンクが表示されることに注意してください。

  5. ブランチ上でコードをコミットし、ビルドします。そして、データセットのヘルスタブ(同じくブランチ上)でチェックを確認します。

  6. コードを master にマージし、ビルドします。