5B. [Repositories] Publishing and Using Shared Libraries in Code Repositories14 - データフローグラフでパイプラインを文書化する
Warning

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

14 - データフローグラフを使ってパイプラインを文書化する

learn.palantir.com ↗でも以下の内容をご覧いただけますが、アクセシビリティの観点から、ここに掲載しています。

📖 タスクの概要

次の3つのタスクでは、新たなパイプライン要素への接続ビルドスケジュール、リポジトリ内の README ファイル、そしてプロジェクトのルートに配置できる Data Lineage グラフリソース(Datasource Project: Passengers)を追加します。これらは、Datasource Project: Flight Alerts に対して行ったのと同じ形式のドキュメンテーションです。

これらは、Scheduling Data Pipelines の前のチュートリアルで完了したステップなので、ここでの指示は学んだことを練習する機会を提供するために簡潔にしています。

次に進む前に、新しいクリーンな出力が Master ブランチでビルドされていることを確認してください。

🔨 タスクの説明

  1. ユーザーの passengers_logic リポジトリの Master ブランチから、アプリケーション画面の右上にある Explore lineage ボタンを ctrl+click します。
  2. 画面の左上で、Align アイコンをクリックして、スナップ・トゥ・グリッドの動作を有効にします。
  3. グラフの左側にある2つの *_raw データセットをハイライトし、Expand nodes... を行います。
  4. << ボタンをクリックして Add 2 nodes を行います。
  5. Node color optionsFolder に変更して、パイプラインのステージをより明確に識別します。
  6. データフローグラフを /Datasource Project: Passengers フォルダー内の Passengers Pipeline として保存します。