5B. [Repositories] Code Repositories での共有ライブラリの公開と使用14 - データフローグラフでパイプラインを文書化する

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

14 - データフローグラフでパイプラインを文書化する

📖 タスクの概要

次の3つのタスクでは、パイプラインの新しい要素に対して接続するビルドスケジュールを追加し、ユーザーのリポジトリにREADMEファイルを作成し、プロジェクトのルートに配置できるData Lineageグラフリソースを作成します(Datasource Project:Passengers)。これらはDatasource Project:Flight Alertsのときと同様に文書化の一形態として行います。

これらは、Scheduling Data Pipelinesという前のチュートリアルで完了したステップなので、ここでは指示が簡潔になっており、そこで学んだことを実践する機会を提供します。

作業を進める前に、新しいクリーンな出力がMasterブランチでビルドされていることを確認してください。

🔨 タスクの説明

  1. ユーザーのpassengers_logicリポジトリのMasterブランチから、アプリケーション画面の右上にあるExplore lineageボタンをctrl+clickします。
  2. 画面の左上でAlignアイコンをクリックして、グリッドにスナップする動作を有効にします。
  3. グラフの左側にある2つの*_rawデータセットをハイライト表示し、**Expand nodes...**を選択します。
  4. <<ボタンをクリックし、Add 2 nodesを選択します。
  5. Node color optionsFolderに変更して、パイプラインのステージをより明確に識別します。
  6. データフローグラフをユーザーの/Datasource Project: PassengersフォルダーにPassengers Pipelineとして保存します。