データ接続と統合Pipeline Builder Transforms数値分布

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

数値分布

サポート対象: Batch

指定された列の数値の分布を計算します。

トランスフォームカテゴリ: 数値

引数

  • バケット数 - 分布させるバケットの数。
    Literal<Long>
  • - 分布を計算する列。
    Column<Numeric>
  • データセット - 分布を適用するデータセット。
    Table
  • 最大値 - 分布の最大値。
    Literal<Double>
  • 最小値 - 分布の最小値。
    Literal<Double>

例 1: 基本ケース

引数値:

  • バケット数: 10
  • : value
  • データセット: ri.foundry.main.dataset.a
  • 最大値: 20.0
  • 最小値: 0.0

入力:

value
0.0
0.0
1.3
5.3
10.5

出力:

bucketmin_valuemax_valuecountbucket_startbucket_end
00.01.330.02.0
25.35.314.06.0
510.510.5110.012.0

例 2: 基本ケース

引数値:

  • バケット数: 3
  • : value
  • データセット: ri.foundry.main.dataset.a
  • 最大値: 25.0
  • 最小値: -5.0

入力:

value
-15
-5
0
15
20

出力:

bucketmin_valuemax_valuecountbucket_startbucket_end
0-502-5.05.0
21520215.025.0

例 3: エッジケース

引数値:

  • バケット数: 1
  • : value
  • データセット: ri.foundry.main.dataset.a
  • 最大値: 20.0
  • 最小値: 20.0

入力:

value
-15
-5
0
15
20

出力:

bucketmin_valuemax_valuecountbucket_startbucket_end
02020120.020.0

例 4: エッジケース

引数値:

  • バケット数: 1
  • : value
  • データセット: ri.foundry.main.dataset.a
  • 最大値: 20.0
  • 最小値: -5.0

入力:

value
-15
-5
0
15
20

出力:

bucketmin_valuemax_valuecountbucket_startbucket_end
0-5153-5.020.0
12020120.045.0