注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

はじめに

ヒント

以下の手順では、簡単な Java データ変換を実行します。データ変換を始めたばかりの場合は、まず Pipeline Builder または Code Repositories のバッチパイプラインチュートリアルを検討してください。

最初の Java 変換の作成を開始するには、次の手順に従ってください。

  1. 新しい Transforms Java リポジトリを作成します。プロジェクトに移動し、+ New > リポジトリ を選択し、Language template の下で Java を選択します。

  2. このサンプルデータセットをダウンロードしてください:titanic.zip をダウンロード。このデータセットを Foundry にインポートします。

  3. リポジトリに移動します。データ変換コードは myproject/datasets/HighLevelAutoTransform.java に入ります。このファイルのサンプルコードはコメントアウトされているので、次に進む前にコメントを解除してください。

  4. 入力データセットを更新して、/path/to/input/datasettitanic データセットへのフルパスに置き換えます。

  5. 出力データセットを更新して、/path/to/output/dataset を希望する出力データセットの場所へのフルパスに置き換えます。

  6. デフォルトの変換コードを修正して、titanic データセットを性別に基づいてフィルター処理し、すべての女性の乗客を取得します。my_compute_function のデータ変換コードを更新してください。

    Copied!
    1 2 3 4 5 6 7 @Compute // 出力データセットへのフルパスにこれを置き換えます。 @Output("/path/to/output/dataset") // "titanic" データセットへのフルパスにこれを置き換えます。 public Dataset<Row> myComputeFunction(@Input("/path/to/input/dataset") Dataset<Row> myInput) { return myInput.filter(myInput.col("Sex").equalTo("female")); }
  7. 変更をブランチに正常にコミットした後、出力データセットを開いてビルドできます!

この例では、自動登録を使用した高レベルの Transform を定義しています。Transforms Java でサポートされているデータ変換の種類や、テンプレートプロジェクト構造と含まれるファイルの説明については、このドキュメント を参照してください。