6. Monitoring Data Pipeline Health14 - 重要なポイント
Warning

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

14 - 重要なポイント

learn.palantir.com でも以下の内容をご覧いただけますが、アクセシビリティの観点から、ここに掲載しています。

データパイプラインは、Foundry 内外のさまざまな製品やプロセスにデータを供給します。データを詳細に分析して表示するためにデータを準備したり、Foundry の外部システムにテーブルをエクスポートしたり、オントロジー対応の運用アプリケーションをバックアップしたりすることができます。パイプラインを最終目標を念頭に置いて慎重に構築することで、設置したい監視の種類について意図的になれます。Foundry Scheduler アプリケーションを通じて、パイプラインの入力、出力、中間データセットを定義し、Data Health アプリケーションを使って、それらの入力と出力に対してチェックを設定してパイプラインの健康状態を監視します。

このチュートリアルでは、以下の操作を行いました。

  1. ヘルス通知アラートをバッチ処理するためのチェックグループを作成しました。
  2. 接続されたパイプラインセグメントの入力と出力に推奨されるヘルスチェックを適用しました。
  3. 3つのビルドスケジュールにヘルスチェックを適用しました。

以下は、このトレーニングで使用された製品ドキュメントのリストです。

データエンジニアは、パイプラインとデータセットをより細かく監視したい場合、Data Expectations というフレームワークを使って、変換リポジトリにコードベースのチェックを定義することができます。次のチュートリアルでは、期待値ライブラリを探索し、パイプラインにいくつかの選択肢を適用する方法をお手伝いします。