データ接続と統合Pipeline Builder TransformsKey by

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

Key by

対応環境: Streaming

指定されたキー列で入力をキー化します。データを再ソートすることはなく、キーが設定された時点から各キーごとの順序を維持します。新たにキー化されたデータが特定の順序に依存している場合、前のキー設定でその順序が維持されていなかった場合にはその順序を保証できないため、データの再キー化は安全でない可能性があります。さらに、cdc(変更データキャプチャ)モードが有効な場合、主キーを設定します。主キーは、更新、削除、現在のビューとして読み取られる際の順序を示す列を定義します。

トランスフォームカテゴリ: その他

宣言された引数

  • Dataset - Key by を実行するデータセット。
    Table
  • Enable cdc mode - false の場合、順序保証を制御するパーティション列のみが設定されます。すべてのキー列に同じ値を持つ行は、受信した順序で出力されます。true の場合、パーティション列と主キーの両方が設定され、順序保証の変更に加えて、すべてのキー列に同じ値を持つ行をどのように重複排除するかの設定も行われます。
    Literal<Boolean>
  • Key by columns - 入力をキーでパーティション化する列。変更データキャプチャが有効(主キーのパラメーターを指定)されている場合、これらの列も更新を定義するために使用されます。ある行が更新とみなされるのは、そのキー値が前の行のキー値と完全に一致する場合です。
    Set<Column<AnyType>>
  • optional Primary key is deleted column - cdc モードが有効である必要があります。変更データキャプチャで削除を定義するために使用されます。削除列の値が true に設定されており、キー列が削除されるべき行と完全に一致する場合、その行は削除とみなされます。
    Column<Boolean>
  • optional Primary key ordering columns - cdc モードが有効である必要があります。ストリームでは空白のままにすることを推奨します。変更データキャプチャでバッチおよびアーカイブデータセットの順序を定義するために使用されます。ある行が更新または削除されるのは、それが変更しようとしている行の後に来る場合のみです。空白のままにし、ストリーミング cdc モードの場合、最新にストリームされた行が常に優先されます。
    List<Column<Byte | Date | Decimal | Integer | Long | Short | String | Timestamp>>