7. [Repositories] データ期待値の設定9 - 重要なポイント

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

9 - 重要なポイント

データの期待値をユーザーのパイプライン管理手法に追加することで、ヘルスチェックの細かい制御と、予期せぬデータが下流のリソースに伝播するのを防ぐ能力が得られます。そして、これらのチェックはユーザーのGitを利用したリポジトリで定義されているため、標準のデータヘルスチェックよりも厳格な変更管理が適用されます。

このチュートリアルでは、ユーザーは:

  1. flight_alerts_clean データ変換に主キーチェックを追加しました。
  2. flight_alerts_clean 変換コードに行の期待値is_in)を追加しました。
  3. flight_alerts_joined_passengers 変換コードにgroup-by expectationis_unique)を追加しました。
  4. flight_alerts_by_country 変換ジェネレーターコードにschema expectationチェックを追加しました。

以下は、このトレーニングの過程で使用された製品ドキュメンテーションのリストです:

次のチュートリアルでは、Foundry オントロジーを紹介し、オントロジーが可能にする運用ワークフローをサポートするための最適なデータセットの生成プロセスをガイドします。