Warning

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

HyperAuto V1からV2への移行

HyperAuto V2が一般に利用可能になると、V1はsunsetとなります。新たなV1パイプラインの作成は推奨されず、次の12ヶ月間でユーザーはHyperAuto V1からV2への移行を詳細に下記の通り進めるべきです。 HyperAuto V2はHyperAuto V1から大幅にアップグレードされ、パフォーマンスと機能性が向上しています。これには以下が含まれます:

  • ポイントアンドクリックのウィザードを使用した簡単な設定プロセス。
  • Pipeline Builderパイプラインを生成する能力。これにより、データがどのように処理されているかを完全に透明にすることができ、包括的な変更管理ワークフローと大幅なパフォーマンスの向上が得られます。
  • 入力データのリアルタイムストリーミング。これにより、時間が重要な運用アプリケーションが可能になります。

HyperAuto V1とV2の主な機能の違い

重要なHyperAuto V2の更新と変更は以下のとおりです。

ソースタイプのサポート

2024年4月29日現在、HyperAuto V2はSAPデータのみをサポートしています。V1のSAPデータを使用しているユーザーは、V2への使用を開始することを強く推奨します(Getting startedを参照)。

マルチソースのサポート

HyperAuto V1では、ユーザーは単一のパイプラインを複数のソースに接続し、最後に広範なユニオンを行うことができました。しかし、このアプローチは予期しない結果を生むことがあり、現在では推奨されていません。特に、sourceをプレフィックスとして使用していたプライマリキーと外部キーは、ソース名が変更された場合に壊れる可能性があります。

HyperAuto V2では、各パイプラインは一つのソースにのみ接続することができます。その結果、source列は出力データセットには生成されず、プライマリキーや外部キーギネレーションにプレフィックスとして使用されることはなくなりました。

この機能が必要なユーザーは、HyperAuto V2の下流でユニオンを実行するパイプラインを再実装することを推奨します。

外部キーの生成

HyperAuto V1は許容的な外部キー生成のアプローチを実装しており、これによりしばしば、基礎となるデータの関係性を正確に反映していないテーブル間に外部キーが生成され、潜在的な不正確さや誤解を招く解釈を生むことがありました。

HyperAuto V2でのキー生成のロジックは、より保守的なアプローチを使用して正確性を向上させるために更新されており、その結果、外部キーカラムのリストは異なります。V2で外部キーが誤って省略されたと考えられる場合は、パランティアの担当者に連絡してください。

列のリネーム

HyperAuto V2はより豊富なメタデータを使用して列をリネームします。これにより、HyperAuto V1と比較して出力データセットの列名が異なる可能性があります。

カスタムクリーニング関数

HyperAuto V2は、パイプラインの一部として適用されるカスタムクリーニング関数の実装をサポートしていません。ユーザーはHyperAutoの下流で自分のカスタムロジックを実装するパイプラインを作成することを推奨します。

入力のバッチユニオン

HyperAuto V2は、同一の出力テーブルにリンクする複数の同期を設定することをサポートしていません(V1ではbatch union componentsとして知られています)。ユーザーは、HyperAuto V2への事前に入力をユニオンし、その後、HyperAutoから消費するためのfolder-based pipelineを設定することを推奨します。

既存のHyperAuto V1パイプラインをHyperAuto V2に移行する

ユーザーは以下のようにして、パイプラインをHyperAuto V1からV2へ段階的に移行することを推奨します:

  1. 既存のV1の設定を複製し、同じ入力を消費する新しいHyperAuto V2パイプラインを作成します。
  2. パイプラインの下流の消費者(リポジトリ、分析、アプリケーション)を特定し、それらを新しいHyperAuto V2の出力に段階的に向けます。

HyperAuto V2への移行をしないと決定した場合、既存のV1リポジトリはそのままにされますが、元のテンプレートから「切断」されます。これは、リポジトリが通常のPython Transformsリポジトリに変換され、他のカスタムリポジトリと同様にユーザーが所有することを意味します。

元のテンプレートからHyperAuto V1リポジトリを切断した後、automatic pull request creation processは終了し、ユーザーは手動でプルリクエストを作成してV1の設定を更新する必要があります。