注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

5 - 初めての(「アイデンティティ」)トランスフォーム

📖 タスクの概要

この演習では、チュートリアルの紹介で参照されている3つのrawデータセットのバージョンを、ユーザーのデータソースプロジェクトに出力するシンプルな「アイデンティティトランスフォーム」を作成します。

実際の外部接続ソースからこのrawデータセットを作成していないため、このステップが必要であることを思い出してください。プロダクションシナリオでは、データ接続は../datasets/raw/のプロジェクトに同期したテーブルを出力するように設定されていたでしょう。

🔨 タスクの説明

  1. ユーザーのflight_alerts_logicコードリポジトリの左側には、そのファイルの折りたたまれたリストが表示されています。Filesセクションの/transforms-pythonフォルダーにマウスを移動し、右側に表示される...をクリックします。次に、Expand allを選択します。
  2. /datasetsフォルダーを右クリックし、New folderを選択します。表示されるウィンドウで、New nameフィールドに"raw"と入力し、右下の青いCreateボタンをクリックします。Filesセクションは、未コミットの変更を含むフォルダーのパスを強調表示します。新しい/rawフォルダーは自動的に__init__.py fileで準備されます。
  3. 新しい/rawフォルダーを右クリックし、New fileを選択します。
  4. New nameフィールドにflight_alerts_raw.pyと入力し、Createをクリックします。コードエディタウィンドウは、データトランスフォームの基本構造を提供します。これには、出力パスの提案と、ユーザーが入力データセットを定義するためのプレースホルダーが含まれます。
  5. **“SOURCE_DATASET_PATH”**を、ユーザーのFoundry環境で提供されたrawデータセットの入力パスに置き換えます:"/{$}/Foundry Training and Resources/Example Projects/[Datasource] Flight Alerts/datasets/raw/flight_alerts_raw"
  6. ユーザーのFoundry管理者は、Foundry Training and Resourcesプロジェクトを含むnamespaceを設定しており、それが結果としてすべてのプロジェクトファイルパスのルートとして表示されます。ユーザーがflight_alerts_raw.pyファイルを作成したとき、Foundryはそのnamespaceをトランスフォームの行6のOutputファイルパスに追加しました。

ステップ5の{$}をその同じnamespaceで置き換えます。以下の画像では、namespaceは/Publicと呼ばれていますが、ユーザーの組織では異なる可能性があることに注意してください。

ユーザーの出力がFoundry Training and Resourcesプロジェクトには含まれていないため、Inputラインが赤で下線が引かれていることに気付くでしょう。これはエラーを示しています。この問題を解決するためには、ここで示されているプロセスを使用してProject Referenceを作成する追加のステップを踏む必要があります。