5C. [Repositories] データ変換による複数の出力9 - 接続ビルドスケジュールの設定

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

9 - 接続ビルドスケジュールの設定

📖 タスクの概要

データセットは一つのスケジュールにのみ所属すべきです。

ユーザーのデータソースと変換ステージを接続するにあたり、データセットを不必要にビルドすることを避けたいと考えています。ユーザーの2つのデータソースプロジェクトからの三つのクリーンな出力は、変換ステージのパイプラインへの入力として機能しますが、以前に設定したスケジュールのターゲットとして、新しいスケジュールで再度ビルドする必要はありません。代わりに、それらは接続ビルドスケジュールの入力として機能します。接続ビルドのロジックは、入力とターゲットの間の全てをビルドしようと試みますが、入力は除外し、ターゲットは含むということを思い出してください。

🔨 タスクの説明

  1. 前のタスクで保存したデータフローグラフを開きます。必要に応じてFlowアニメーションをオフにします。

  2. 画面の右側にあるManage schedulesボタンをクリックします。

  3. ユーザーの他の二つのスケジュールがスケジューラUIに表示されます。それらを交互にマウスオーバーして、グラフ上の「クリーン」なデータセットが既にスケジュールのターゲットであることを確認します。

  4. 新しいスケジュールを作成し、それにユーザー名 Alert Metrics Schedule(例:Jmeier Alert Metrics Schedule)と名付けます。説明を追加します:Transform Project: Alert Metrics のビルドスケジュール

  5. 接続ビルドに切り替えてから、「何が」、「いつ」ビルドするかを定義します:

    • 生成されたデータセットとマルチ出力データセットすべてをスケジュールのターゲットとして設定します。
    • 三つの「クリーン」データセットを入力トリガーとして設定します(つまり、それらを入力として設定し、さらにトリガーとして設定します。後者はパイプラインが「いつ」ビルドするかを定義します。)
  6. Build scopeProject Scoped に変更します。

  7. Advanced options を開き、失敗時にスケジュールを中止するように設定し、リトライは3回で、リトライ間隔は1分に設定します。

  8. スケジュールを保存します。