データ接続と統合Pipeline Builder Transformsピボット

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

Pivot

サポートされている環境: Batch

指定された集計を、列のセットでグループ化された入力データセットに対して実行します。ピボットするためのユニークな値を事前に提供する必要があり、これにより実行時のスキーマが既知であることが保証されます。これにより、実行時の安定性が向上します。

トランスフォームカテゴリ: 集計, 人気

引数

  • Aggregations - データセットに対して実行する集計のリスト。
    List<Expression<AnyType>>
  • Dataset - 集計を実行するデータセット。
    Table
  • Group by columns - 集計時にデータセットをグループ化する列のリスト。
    List<Column<AnyType>>
  • Pivot by column - ピボットする列。
    Column<T>
  • Pivot by values - ピボットに使用するユニークな値のリストと出力のエイリアス。エイリアス値は、prefix / suffix 引数に従って出力列名を構築するために使用されます。
    List<Tuple<Literal<T>, Literal<String>>>
  • オプション Prefix or suffix alias - プレフィックスの場合、出力列名は 'alias''aggregate' になります。サフィックスの場合、'aggregate'alias になります。
    Enum<Prefix, Suffix>

型変数の制約: T は Boolean | Byte | Integer | Long | Short | String を受け入れます

例 1: 基本ケース

引数の値:

  • Aggregations: [
    alias(
     alias: miles,
     expression:
    mean(
     expression: miles,
    ),
    )]
  • Dataset: ri.foundry.main.dataset.a
  • Group by columns: [airline]
  • Pivot by column: airport
  • Pivot by values: [(JFK, new_york), (LHR, london)]
  • Prefix or suffix alias: null

入力:

airlineairportmiles
foundry airwaysJFK1002345
foundry airwaysLHR2221324
new airSFO21356673
new airJFK12323456
foundry airwaysLHR12542352
new airJFK12232355

出力:

airlinenew_york_mileslondon_miles
foundry airways1002345.07381838.0
new air1.22779055E7null

例 2: 基本ケース

引数の値:

  • Aggregations: [
    alias(
     alias: miles,
     expression:
    mean(
     expression: miles,
    ),
    )]
  • Dataset: ri.foundry.main.dataset.a
  • Group by columns: [airline]
  • Pivot by column: airport
  • Pivot by values: [(JFK, new_york), (LHR, london)]
  • Prefix or suffix alias: SUFFIX

入力:

airlineairportmiles
foundry airwaysJFK1002345
foundry airwaysLHR2221324
new airSFO21356673
new airJFK12323456
foundry airwaysLHR12542352
new airJFK12232355

出力:

airlinemiles_new_yorkmiles_london
foundry airways1002345.07381838.0
new air1.22779055E7null