7. [Builder] Configuring Data Expectations1 - このコースについて
Warning

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

1 - このコースについて

learn.palantir.com でも以下の内容をご覧いただけますが、アクセシビリティの観点から、ここに掲載しています。

Data Health のチェックは、ビルド完了後に、チェックの種類に応じてさまざまなバックエンドプロセスを使用して実行されます。ビルドまたはジョブ完了後に変換ロジックから切り離して実行されるため、ビルドを失敗させるためには使用できません。言い換えれば、プライマリキーの一意性のヘルスチェックをインストールした場合、失敗の通知だけが行われ、望ましくないデータが下流に続く可能性があります。

それに対して、Foundry の Data Expectations ライブラリは、Pipeline Builder で呼び出すことができ、達成されない場合にジョブを失敗させるヘルスチェックを作成し、コードパイプラインにおける期待されるデータの形状とサイズについての「ドキュメンテーション」のレイヤーを追加できます。したがって、エンコードされたプライマリキーのデータ期待値が失敗した場合、ジョブは失敗し、予期しないデータは下流に伝播しません。さらに、エンコードされた期待値は、設定した標準的なものと並んで Data Health アプリに表示されます。

⚠️ コースの前提条件

DATAENG 06:このトラックの前のコースをまだ完了していない場合は、今すぐそれを行ってください。

アウトカム

場合によっては、前のチュートリアルで適用したようなデータヘルスチェックが、パイプラインの監視に十分な場合もあります。完全な監視と保護プログラムは、より粒度の高い制御とともに Data Expectations フレームワークを利用するべきです。この短いチュートリアルでは、これらのチェックをパイプラインに追加し、Data Health アプリケーションでそれらを表示する方法を練習します。

🥅 学習の目的

  • Pipeline Builder でデータ期待値チェックをいつ、どのように適用するかを理解する。

💪 Foundry のスキル

  • Pipeline Builder で Data Expectations チェックを適用する。
  • Data Health アプリで期待値チェックを表示する。