5. [Builder] Transforms Project9 - フライトアラートと乗客の結合

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

9 - フライトアラートと乗客を結合する

この内容は learn.palantir.com ↗ でもご覧いただけますが、アクセシビリティの観点から、ここに掲載しています。

📖 タスクの概要

トランスフォームプロジェクトは通常、ソースを結合し、追加のビジネスロジックを適用して、強化されたデータセットを生成します。一般的に、これらのデータセットはオントロジープロジェクトの段階にあるもののように、一般に公開されることを意図していません。このタスクでは、フライトアラートと乗客のデータソースプロジェクトからの 3 個のクリーンな出力データセットをシンプルに結合します。これは /transformed コードフォルダーで行う「事前作業」の一例です。

フライトアラートのデータセット(約 2.5k 行)から開始します。乗客データ(約 10k 行)との最終的な結合を可能にするために、まず passenger_flight_alert_clean 結合テーブル(約 132k 行)を使用する必要があります。このテーブルには、フライトアラートと乗客テーブルの主キーが含まれています。

🔨 タスクの説明

  1. 前の演習で作成した /transformed フォルダーを開きます。

  2. Pipeline Builder で passengers_flight_alerts_transformed という名前の新しいバッチパイプラインを作成します。

  3. このラーニングパスで作成した次のクリーンデータセットを追加します:

    • flight_alerts_clean
    • passengers_clean
    • passenger_flight_alert_clean
  4. flight_alerts_clean にトランスフォームを追加し、alert_display_namepassenger_flight_alert_clean を左結合します。

  5. トランスフォームに Alerts to Join Table という名前を付けます。

  6. Alerts to Join Table トランスフォームを passengers_cleanpassenger_id を共有キーとして使用して結合する新しいトランスフォーム Alerts to Passengers を作成します。

  7. パイプラインを保存します。