注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。
パイプラインをデプロイした後、flight_alerts_clean
データセットが改善できるとのフィードバックを受け取ります:
rule_id
行はどのコンテキストでも有用ではないため、削除するべきです。comment
とassignee
の行があると運用上便利です。これらはデフォルトでNone
の値を持つべきです。このタスクでは、クリーンなパイプラインをブランチ化し、これらの変更を開発しテストし、それからそれらをメインブランチにマージします。以下の指示は、Pipeline Builderでのブランチ化を通じてあなたを導きます。Pipeline Builderでのブランチ化について詳しく読みたい場合は、以下のリソースを参照してください: Pipeline Builderブランチングのドキュメンテーション:ブランチの作成 → 変更の提案 → 変更の承認
クリーンなパイプラインを開き、画面右上の Main ▾ ドロップダウンをクリックしてdevelop
という新しいブランチを作成します。
アウトプットのクリーンデータセットとFlight Alert Status Join
変換の間に新しい変換ステップを導入します。
新しい変換パスにAdditional Cleaning
とラベルを付け、次の変換を追加します:
rule_id
行をドロップしますcomment
という名前の定数行を追加し、デフォルトの文字列値をNone
にしますassignee
という名前の定数行を追加し、デフォルトの文字列値をNone
にしますグラフに戻ると、新しい変換が自動的にflight_alerts_clean
アウトプットに接続されているはずです。Pipeline Builderがスキーマの不一致を検出していることに注意してください。アウトプットはrule_id
を探しており、新しい定数行を適切に受け入れるように設定されていません。
右側のPipeline outputsパネルで、Editボタンをクリックし、青いUse updated schemaボタンをクリックしてスキーマを再ベースライン化し、変換ロジックに合わせます。
パイプラインをデプロイします。
アウトプットデータセットノード上で右クリックし、Openを選択します(↗
ボタンを右クリックしてデータセットを新しいタブで開きます)。
Dataset Previewアプリの左上にあるエリアで、データセットが2つのブランチに存在することがわかります:Master(パイプラインのMainに対応します)とDevelop、これはあなたが作成したものです(データセットが実際にまだビルド中かもしれません)。
変更点は良好に見えます。パイプラインに戻り、画面右上のProposeボタンをクリックし、DevelopブランチをMainにマージするためのプロンプトに従います。マージする前に、Deploy branch "Main" after merging this proposalのオプションを選択することを忘れないでください。