注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

頻繁パターン成長

サポートされている環境: バッチ

頻繁パターン (fp) 成長は、ユーザーのデータセット内の頻繁なパターンを見つけます。

トランスフォームカテゴリ: 集計、その他

宣言された引数

  • 入力データセット - アイテム列とトランザクション列を含むソースデータセット。
    テーブル
  • アイテム列 - パターンのアイテムを含む配列列。
    列<配列<文字列>>
  • 最小サポート - パターンが存在するために必要な最小の割合。
    リテラル<倍精度浮動小数点>

例 1: 基本ケース

引数の値:

  • 入力データセット: ri.foundry.main.dataset.a
  • アイテム列: customer_attributes
  • 最小サポート: 0.6

入力:

customer_attributes
[ age_group: 20-30, country: Germany, gender: Female ]
[ age_group: 20-30, country: Germany, gender: Male ]

出力:

patternpattern_occurrencetotal_count
[ country: Germany, age_group: 20-30 ]22
[ age_group: 20-30 ]22
[ country: Germany ]22

例 2: Null ケース

引数の値:

  • 入力データセット: ri.foundry.main.dataset.a
  • アイテム列: customer_attributes
  • 最小サポート: 0.0

入力:

customer_attributes
null

出力:

patternpattern_occurrencetotal_count

例 3: Null ケース

引数の値:

  • 入力データセット: ri.foundry.main.dataset.a
  • アイテム列: customer_attributes
  • 最小サポート: 0.0

入力:

customer_attributes
[ age_group: 20-30, country: Germany, gender: Female ]
[ null ]

出力:

patternpattern_occurrencetotal_count
[ country: Germany ]12
[ country: Germany, age_group: 20-30 ]12
[ null ]12
[ age_group: 20-30 ]12
[ gender: Female ]12
[ gender: Female, country: Germany ]12
[ gender: Female, country: Germany, age_group: 20-30 ]12
[ gender: Female, age_group: 20-30 ]12

例 4: エッジケース

引数の値:

  • 入力データセット: ri.foundry.main.dataset.a
  • アイテム列: customer_attributes
  • 最小サポート: 0.0

入力:

customer_attributes
[ age_group: 20-30, country: Germany, gender: Female ]
[ age_group: 20-30, country: Germany, gender: Male ]

出力:

patternpattern_occurrencetotal_count
[ gender: Male ]12
[ gender: Male, country: Germany ]12
[ gender: Male, country: Germany, age_group: 20-30 ]12
[ gender: Male, age_group: 20-30 ]12
[ age_group: 20-30 ]22
[ country: Germany ]22
[ country: Germany, age_group: 20-30 ]22
[ gender: Female ]12
[ gender: Female, country: Germany ]12
[ gender: Female, country: Germany, age_group: 20-30 ]12
[ gender: Female, age_group: 20-30 ]12