1. データパイプラインの基礎7 - ユーザーのプロジェクト構造の作成

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

7 - ユーザーのプロジェクト構造の作成

実際には、各パイプラインのステージをそれぞれのプロジェクトとして設定することが望ましいです。しかし、練習の便宜上、これらはユーザーのパーソナルサンドボックスフォルダーに生成されます。この演習では、パイプラインの構築を開始するために必要な基本的なプロジェクトフォルダー構造を生成します。

🔨 タスクの説明

  1. チュートリアルで使用するためのパーソナルサンドボックスフォルダーをすでに作成している場合は、そのフォルダーに移動します。まだ作成していない場合は、Palantir Foundry 入門チュートリアルのサンドボックスフォルダー作成ページから手順を参照して、今すぐ作成します。

  2. ユーザーのパーソナルサンドボックスフォルダーで、新しいフォルダーを作成します(画面右上の緑色の ➕ New ボタンを使用)。フォルダーには、ユーザーがこのコースを受講しているラーニングパスのカリキュラムに基づいた名前を付けます:

    • Pipeline Builder フォーカスのパス、Data Engineering Learning Path (Pipeline Builder) を受講している場合は、フォルダーの名前を Data Engineering Tutorials - Pipeline Builder にします。
    • それ以外の場合、Code Repository フォーカスのパス、Data Engineering Learning Path (Code Repository) を受講している場合は、フォルダーの名前を Data Engineering Tutorials - Code Repository にします。
  3. 新しく作成したフォルダーをお気に入りに追加するには、ファイル名の隣にある☆シンボルをクリックします。

  4. 新しく作成した /Data Engineering Tutorials フォルダーに移動し、Datasource Project: Flight Alerts という新しいサブフォルダーを作成します。

  5. 新しく作成した /Datasource Project: Flight Alerts フォルダーに、以下のサブフォルダーを追加します:

    • /documentation
    • /analysis
    • /scratch

/data または /datasets フォルダーの追加もお勧めします。次のチュートリアルでデータ変換を開発する際に、これをプログラムで追加します。