注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

トランスフォームの作成

トランスフォームは、ファイルテンプレート構成ウィザードを使用してCode Repositoriesで作成できます。このウィザードを使用すると、トランスフォームのタイプを選択し、入力または出力データセットなど、トランスフォームに必要な変数の値を提供することで、最小限の例をブートストラップできます。

ウィザードを使用して始めるには、新しいPythonトランスフォームリポジトリを作成します。ウィザードは自動的に開かれます。既存のリポジトリでは、ファイルのサイドパネルでAddを選択し、次にNew file from templateを選択することでウィザードを開くことができます。

Code Repositoriesの'Add'メニュー内の'New file from template'メニューオプション

ウィザードを開いた後、テンプレートを選択するように求められます。各テンプレートはトランスフォームのタイプを表します。異なるオプションを対比し、ユーザーのユースケースに適した選択を特定するためのイラストと説明が提供されています。利用可能なテンプレートには以下が含まれます。

  • 軽量トランスフォーム: 一般的に 1,000 万行未満のデータセットに対して動作するトランスフォームに推奨されます。
  • Sparkトランスフォーム: 分散コンピューティングを活用し、1,000 万行を超えるデータセットのトランスフォームに対してより良いパフォーマンスを可能にします。

Sparkと軽量トランスフォームのオプションがあるウィザードのテンプレート選択ページ

テンプレートを選択した後、Nextを選択してテンプレート構成ページを開きます。ここで必要な値を提供し、Foundry全体からリソースを選択することでテンプレートを構成できます。このページには、現在の構成に基づいたトランスフォームのライブプレビューが表示されます。入力または出力変数を変更するとプレビューが更新されます。この段階で構成が自動的に検証され、エラーがある場合はトランスフォームが作成される前に対処する必要があります。

一般的な検証エラーには以下が含まれます。

  • 異なるプロジェクトからのリソースの使用: 入力および出力リソースはリポジトリと同じプロジェクト内に含まれている必要があります。
  • 重複したパラメーター名: トランスフォーム内のすべてのパラメーター名は一意である必要があります。
  • 必要なパラメーターの未提供: 一部のテンプレートでは、少なくとも 1 個の入力または出力変数が必要です。エラーを解決するために有効な変数値を提供します。

必要な入力および出力変数を表示するウィザードの構成ページ

構成が有効になると、Generate fileを選択してトランスフォームを作成できるようになります。これにより、構成ページのプレビューに表示されている内容を持つ新しいファイルがリポジトリに作成されます。テンプレートが特定のバックエンドの依存関係やライブラリを必要とする場合、それらはトランスフォームが正しく実行されるように自動的に構成されます。