データ接続と統合Pipeline Builder Transforms重複の削除

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

重複を削除

対応バージョン: Batch

入力から重複する行を削除します。

トランスフォームカテゴリ: その他

引数

  • Dataset - 重複を除去するデータセット。
    Table
  • オプション 列サブセット - 列が指定されている場合、指定された列のみが一意性の判定に使用されます。
    Set<Column<AnyType>>

例 1: 基本ケース

引数の値:

  • Dataset: ri.foundry.main.dataset.aggregate
  • 列サブセット: {tail_number}

入力:

tail_numberairlinemilesfactor
XB-123foundry air1242
MT-222new airline11235
XB-123foundry airline3355
MT-222new air5654
KK-452new air2221
XB-123foundry airline11343

出力:

tail_numberairlinemilesfactor
XB-123foundry air1242
MT-222new airline11235
KK-452new air2221

例 2: 基本ケース

説明: サブセットが指定されていない場合、完全に重複するデータを探します。 引数の値:

  • Dataset: ri.foundry.main.dataset.aggregate
  • 列サブセット: {}

入力:

tail_numberairlinemilesfactor
XB-123foundry air1242
XB-123foundry air1242
XB-123foundry air1242
MT-222new airline11235
MT-222new airline11235

出力:

tail_numberairlinemilesfactor
XB-123foundry air1242
MT-222new airline11235