ドキュメントの検索
karat

+

K

APIリファレンス ↗
5B. [Repositories] Code Repositories での共有ライブラリの公開と使用10 - データセットは最新ですか?
Feedback

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

10 - データセットは最新ですか?

📖 タスクの概要

ビルドがどれだけ最新かを一般的に把握しているかもしれませんが、パイプラインが複雑になり、依存関係グラフが拡大するにつれて、パイプラインの一部が他の部分と比較して最新であるかどうかを直感的に判断することが難しくなります。このタスクでは、ビルディング・ナラティブから一旦離れ、データフロー グラフを使って、flight_alerts_logic リポジトリで作成されたデータセットの最新性を評価します。

🔨 タスクの説明

  1. flight_alerts_logic リポジトリでフィーチャーブランチを Master にマージしたら、リポジトリの右上にある Explore lineage ボタンを ctrl+click します。

  2. データフローで、右上のノード着色オプションを out-of-date に変更します。

  3. out-of-date ノードカラーレジェンドの下部で、Data out-of dateLogic out-of-date オプションをオン・オフして、着色の違いに注目してください。データフロー ノード着色ドキュメント にアクセスし、テーブルの out-of-date 項目の説明を確認してください。

    これは、パイプラインが全体的に最新であるかどうか、およびビルドの問題を修正するための参照先を見つけるための貴重なノード着色オプションです。今回のケースでは、Master ブランチに新しいものはビルドされていないため、ノードの Data はすべて現行のものが表示されます。ただし、Master ブランチには新しいロジックがあるため、Logic ボックスにチェックを入れると、新しいロジックと同期されていないデータセットが表示されます。

  4. ctrl+a でグラフ上のすべてのノードを選択します。

  5. 右側の折りたたまれたサイドメニューにある「ハンマー」アイコン(「ビルドの管理」)をクリックします。

  6. Selected dataset(s) only を選択し、青い Next (View preview) ボタンをクリックします。

  7. 画面の右下にある青い Run build ボタンをクリックします。処理が完了すると、データセット(Data と Logic)がグラフ上で更新された状態で表示されます。