注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。
データのタイムリーさは、パイプラインのメンテナとデータ消費者の両方にとって主要な関心事です。Time Since Last Updated (TSLU) チェックは、パイプラインが必要な間隔で更新されることを確認するのに役立ちます。バラエティのために、このタスクでは、前のタスクで Data Lineage で行ったように、Data Health アプリケーションを使用して、Flight Alerts スケジュールビルドの出力に TSLU チェックをインストールする方法を説明します。どちらの方法でも、ヘルスチェックを追加することができます。
flight_alerts_clean
ノードを右クリックし、フライアウトメニューで単語 Open(↗
ではなく)をクリックして、データセットを Dataset アプリケーションで開きます。1
をクリックして、Data Health アプリを Dataset アプリ内のタブとして開きます。flight_alerts_raw
に新しいロジックがある場合)。実際のソースシステムが独自のスケジュールを持っていれば、外部ソースから新しいデータがどの程度の頻度で流れ込むかについてもっとよくわかるでしょう。それがないので、中央値の TSLU からの偏差に基づいて可変の期待値を設定しましょう。1
偏差上に設定します。デフォルトでは、チェックの作成者は自動的にチェックの失敗に対するアラートに登録され、設定されたプリファレンスに応じて、メールやアプリ内通知を受け取ります。このドキュメント のエントリで、これらの設定について詳しく学ぶことができます。また、このページ を読むことで、チェックを「監視」するというニュアンスをさらに理解できます。さらに、このドキュメントページ で時刻ベースのチェックについても学びましょう。
下の画像には、各チェックを個別に一時停止、スヌーズ、編集、または削除する機能が表示されています。