5C. [Repositories] Multiple Outputs with Data Transforms2 - フォルダー構造とリポジトリの作成
Warning

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

2 - フォルダー構造とリポジトリの作成

📖 タスクの概要

トランスフォームプロジェクトは、通常、ソースを組み合わせて追加のビジネスロジックを適用し、豊富なデータセットを生成します。一般的に、これらのデータセットは、オントロジープロジェクトの段階でのものとは異なり、一般的に公開することを目的としていません。このタスクでは、ユーザーのトランスフォームプロジェクト用の推奨される高レベルのディレクトリ構造を実装する方法を説明します。

🔨 タスクの説明

  1. .../Temporary Training Artifacts/yourName/Data Engineering Tutorials/フォルダー内に、Transform Project: Alert Metrics という名前の新しいフォルダーを作成します。

  2. そのトップレベルのプロジェクトフォルダー内に、以下のフォルダーを追加します。

    • /data
    • /documentation
    • /analysis
  3. flight_alert_metrics_logic という名前の新しい Python トランスフォームコードリポジトリを作成します。

  4. Master から yourName/feature/join_data という名前の新しいブランチを作成します。

  5. リポジトリの /datasets フォルダー内に、transformed および output という 2 つの新しいサブフォルダーを作成します。これにより、トランスフォームによって出力されたデータセットが、ドキュメントで推奨されるフォルダー構造に配置されます。

    • 要するに、output フォルダーは、Transforms Project の最終成果物を表し、その出力成果物を作成するために必要な事前作業は、transformed フォルダーで行われます。