注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。
HyperAuto V2が一般に利用可能になると、V1はsunsetとなります。新たなV1パイプラインの作成は推奨されず、次の12ヶ月間でユーザーはHyperAuto V1からV2への移行を詳細に下記の通り進めるべきです。 HyperAuto V2はHyperAuto V1から大幅にアップグレードされ、パフォーマンスと機能性が向上しています。これには以下が含まれます:
重要なHyperAuto V2の更新と変更は以下のとおりです。
2024年4月29日現在、HyperAuto V2はSAPデータのみをサポートしています。V1のSAPデータを使用しているユーザーは、V2への使用を開始することを強く推奨します(Getting startedを参照)。
HyperAuto V1では、ユーザーは単一のパイプラインを複数のソースに接続し、最後に広範なユニオンを行うことができました。しかし、このアプローチは予期しない結果を生むことがあり、現在では推奨されていません。特に、source
をプレフィックスとして使用していたプライマリキーと外部キーは、ソース名が変更された場合に壊れる可能性があります。
HyperAuto V2では、各パイプラインは一つのソースにのみ接続することができます。その結果、source
列は出力データセットには生成されず、プライマリキーや外部キーギネレーションにプレフィックスとして使用されることはなくなりました。
この機能が必要なユーザーは、HyperAuto V2の下流でユニオンを実行するパイプラインを再実装することを推奨します。
HyperAuto V1は許容的な外部キー生成のアプローチを実装しており、これによりしばしば、基礎となるデータの関係性を正確に反映していないテーブル間に外部キーが生成され、潜在的な不正確さや誤解を招く解釈を生むことがありました。
HyperAuto V2でのキー生成のロジックは、より保守的なアプローチを使用して正確性を向上させるために更新されており、その結果、外部キーカラムのリストは異なります。V2で外部キーが誤って省略されたと考えられる場合は、パランティアの担当者に連絡してください。
HyperAuto V2はより豊富なメタデータを使用して列をリネームします。これにより、HyperAuto V1と比較して出力データセットの列名が異なる可能性があります。
HyperAuto V2は、パイプラインの一部として適用されるカスタムクリーニング関数の実装をサポートしていません。ユーザーはHyperAutoの下流で自分のカスタムロジックを実装するパイプラインを作成することを推奨します。
HyperAuto V2は、同一の出力テーブルにリンクする複数の同期を設定することをサポートしていません(V1ではbatch union componentsとして知られています)。ユーザーは、HyperAuto V2への事前に入力をユニオンし、その後、HyperAutoから消費するためのfolder-based pipelineを設定することを推奨します。
ユーザーは以下のようにして、パイプラインをHyperAuto V1からV2へ段階的に移行することを推奨します:
HyperAuto V2への移行をしないと決定した場合、既存のV1リポジトリはそのままにされますが、元のテンプレートから「切断」されます。これは、リポジトリが通常のPython Transformsリポジトリに変換され、他のカスタムリポジトリと同様にユーザーが所有することを意味します。
元のテンプレートからHyperAuto V1リポジトリを切断した後、automatic pull request creation processは終了し、ユーザーは手動でプルリクエストを作成してV1の設定を更新する必要があります。