注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。
以下の手順では、簡単な Java データ変換を実行します。データ変換を始めたばかりの場合は、まず Pipeline Builder または Code Repositories のバッチパイプラインチュートリアルを検討してください。
最初の Java 変換の作成を開始するには、次の手順に従ってください。
新しい Transforms Java リポジトリを作成します。プロジェクトに移動し、+ New > リポジトリ を選択し、Language template の下で Java を選択します。
このサンプルデータセットをダウンロードしてください:titanic.zip をダウンロード
。このデータセットを Foundry にインポートします。
リポジトリに移動します。データ変換コードは myproject/datasets/HighLevelAutoTransform.java
に入ります。このファイルのサンプルコードはコメントアウトされているので、次に進む前にコメントを解除してください。
入力データセットを更新して、/path/to/input/dataset
を titanic
データセットへのフルパスに置き換えます。
出力データセットを更新して、/path/to/output/dataset
を希望する出力データセットの場所へのフルパスに置き換えます。
デフォルトの変換コードを修正して、titanic
データセットを性別に基づいてフィルター処理し、すべての女性の乗客を取得します。my_compute_function
のデータ変換コードを更新してください。
Copied!1 2 3 4 5 6 7
@Compute // 出力データセットへのフルパスにこれを置き換えます。 @Output("/path/to/output/dataset") // "titanic" データセットへのフルパスにこれを置き換えます。 public Dataset<Row> myComputeFunction(@Input("/path/to/input/dataset") Dataset<Row> myInput) { return myInput.filter(myInput.col("Sex").equalTo("female")); }
変更をブランチに正常にコミットした後、出力データセットを開いてビルドできます!
この例では、自動登録を使用した高レベルの Transform を定義しています。Transforms Java でサポートされているデータ変換の種類や、テンプレートプロジェクト構造と含まれるファイルの説明については、このドキュメント を参照してください。