3. [Builder] プロジェクト出力の作成3 - クリーニングロジックを追加する

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

3 - クリーニングロジックを追加する

📖 タスクの概要

クリーンなデータセットとは、Foundry のワークフローで使用できるように準備されたデータセットのことです。今回のケースでは、ステータスと優先度のマッピングテーブルのテキストベースの mapped_values をフライトアラートデータセットに結合することです。これにより、フライトデータセットには、ユーザーの同僚が運用状況でより容易に使用できる値が含まれるようになります。 Pipeline Builder の結合変換は、SQL の結合と同様の方法で動作します。結合に慣れていない場合は、W3 Schools のチュートリアル(外部)を使用して、基本を再度学習してください。 Pipeline Builder での結合の仕組みについての簡単な概要は、ドキュメントのこの部分にあります。

🔨 タスクの説明

  1. flight_alerts_preprocessed ノードを選択し、結合変換を追加します。

    注:順序が重要です。例えば、flight_alerts_preprocessed データセットに左結合を実行する場合、これは入力テーブルのフィールドの左側にも表示される必要があります。逆の順序で始めた場合でも心配しないでください。常に "swap" をクリックして、どちらのテーブルが左のテーブルで、どちらが右のテーブルかを設定できます。

  2. 以下のヒントを使用して、priority_mapping_preprocessed ノードと結合します。

    • フライトアラートデータセットの priority 行は、優先度マッピングデータセットの value 行と一致します。
    • 結合ページの Select columns エリアで、右の列のプレフィックスとして priority を使用することを検討してください。
    • 左側の結合から priority 行を安全に削除し、右側から value(プレフィックスを追加した場合は priority_value)を削除できます。
    • 結合のマッチ条件の列が異なるタイプの場合は、結合前に 'Cast' 式を使用して、どちらかの列を一致するタイプに明示的にキャストできます。例えば、priority が整数型で、value が文字列型の場合、以前のボードで priority を文字列型にキャストできます。
  3. 結合ページで、画面の左上部の結合名フィールドにクリックし、デフォルトの(Join)から Flight Alert Priority Join に名前を変更します。

  4. Apply を選択し、下部のプレビューが正確であることを確認します。

  5. 詰まった場合は、下にスクロールして例示された解決策を参照してください。

  6. パイプラインを保存します。