3. [Builder] Creating a Project Output3 - クリーニングロジックを追加する
Warning

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

3 - クリーニングロジックの追加

learn.palantir.com でも以下の内容をご覧いただけますが、アクセシビリティの観点から、ここに掲載しています。

📖 タスクの概要

クリーンなデータセットとは、Foundry のワークフローで使用できる状態に整えられたデータセットのことです。今回のケースでは、ステータスと優先度のマッピングテーブルの text-based mapped_values をフライトアラートのデータセットに結合することが求められます。これにより、フライトデータセットには、運用状況でユーザーの同僚がより容易に利用できる値が含まれるようになります。 Pipeline Builder の Join 変換は、SQL の結合と似たような働きをします。結合に不慣れな場合は、W3 Schools のチュートリアルを参照して基本を再確認してください。 Pipeline Builder での結合の仕組みについては、このドキュメントの一部で簡単に概説されています。

🔨 タスクの説明

  1. flight_alerts_preprocessed ノードを選択し、Join 変換を追加します。

    *注:順序は重要です。例えば、flight_alerts_preprocessed データセットに対して左結合を実行する場合、このデータセットも入力テーブルフィールドの左側に表示される必要があります。逆の順序で始めた場合でも、問題ありません。常に「スワップ」をクリックして、どちらのテーブルが左テーブルで、どちらが右テーブルかを設定できます。

  2. 以下のヒントを使用して、priority_mapping_preprocessed ノードと結合します。

    • フライトアラートデータセットの priority 行は、優先度マッピングデータセットの value 行と一致します。
    • Join ページの Select columns エリアで、右側の列のプレフィックスとして priority を使用することを検討してください。
    • 左側の結合から priority 行を削除し、右側の value(またはプレフィックスを追加した場合は priority_value)を削除することができます。
    • 結合の条件に一致する列の型が異なる場合は、結合する前に 'Cast' 式を使用して、どちらかの列を一致する型に明示的にキャストできます。例えば、priority が整数型で、value が文字列型の場合、前のボードで priority を文字列型にキャストできます。
  3. Join ページで、画面の左上領域にある Join 名フィールドにクリックし、デフォルトの名称(Join)から Flight Alert Priority Join に変更します。

  4. Apply を選択し、プレビューが正確であることを確認します。

  5. 詰まった場合は、下にスクロールして、解決策の例を参照してください。

  6. パイプラインを保存します。