2. [Repositories] データ変換入門9 - 演習のまとめ

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

9 - 演習のまとめ

✅ 演習での成果物

  • パイプラインの Datasource ステージ に特化したコードリポジトリ。
  • 3つの生データ入力のための変換ファイル:flight_alerts_rawstatus_mapping_raw、および priority_mapping_raw
  • 各変換ファイルに対応する、フィーチャーブランチ上で構築されたデータセット。

✅ 学習した内容

  • パイプライン内の各ステージには、専用のコードリポジトリが必要で、そこでコードベースのデータ変換を構造化された環境で開発および保守します。
  • Foundry リポジトリは、Git を使用したコードブランチと管理を可能にし、コード変更に構造と監督をもたらします。
  • 変換が Foundry の別のプロジェクトからデータセットを使用する場合、プロジェクトリファレンスを明示的に行う必要があります。
  • Code Assist はコードリポジトリセッションと並行して実行され、オートコンプリート、コンパイルエラー、およびその他の IDE のような機能を提供します。
  • リポジトリの各コミットおよび/またはビルドは、パイプラインの衛生を確保する CI チェックを開始します。
  • データセットのビルドがコードリポジトリから開始される場合、実行時にリポジトリがあるコードブランチでビルドされます。
  • パイプラインのすべてのステージで統一されたブランチ名を使用することで、下流のブランチが正しい上流ブランチから読み取られるようにします。
  • リポジトリでは、Shrinkwrap ファイルを使用して入力/出力パスを実際のデータセットリソースID(RID)にマップします。ただし、コードエディタのプロンプトを使用して、それらのパスを RID に置き換えることができます。