注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。
ユーザーのユースケースに応じて、入力データセットをスナップショットまたはインクリメンタルとして読み込むことができます。
スナップショット計算は、新たに追加されたデータだけでなく、入力全体に対して変換を行います。出力データセットは、ビルドごとに最新のパイプライン出力で完全に置き換えられます。
最も適している場合:
APPEND
トランザクションを介して更新されない。
SNAPSHOT
トランザクションを使用して書き込まれる場合、入力をインクリメンタルに読み込むことはできません。APPEND
トランザクションを介して更新できない。
インクリメンタル計算は、最後のビルド以降に選択した入力に追加された新しいデータだけに対して変換を行います。これにより計算リソースを節約することができますが、重要な制限事項があります。
パイプラインは、選択された入力データセットが APPEND
または既存のファイルを変更しない UPDATE
トランザクションによって変更された場合にのみ、インクリメンタル計算で実行されます。スナップショット入力をインクリメンタルにマーキングしても効果はありません。
最も適している場合:
APPEND
トランザクションまたは加算的な UPDATE
トランザクションを介して変更されます。
このセクションでは、ユーザーのワークフローに適用可能な制限事項を概説します。インクリメンタル計算のセットアップ前に確認し、適切な実装を確保してください。
詳しくは、Pipeline Builder でのインクリメンタル計算の例をご覧ください。