2. [Builder] Introduction to Data Transformations6 - 前処理ロジック:フライトアラート
Warning

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

6 - 前処理ロジック:フライトアラート

この内容は learn.palantir.com ↗でもご覧いただけますが、アクセシビリティの観点から、ここに掲載しています。

📖 タスクの概要

パイプラインの作成物が作成されたので、特定の問題を修正するためにいくつかの Pipeline Builder の変換を使用する時が来ました。まず、以下の問題が存在する flight_alerts データから始めましょう:

  • 行の名前が様々な形式で表示され、"snake case"(例:flightDate を flight_date に)に標準化する必要があります。
  • カテゴリー行の値を正規化する必要があります。
  • flightDate 行を日付にキャストする必要があります。
  • priority と status 行を整数から文字列にキャストする必要があります。値が実際に整数であるにもかかわらず、数学的な操作が関与する場合のみ整数値を使用することがベストプラクティスです。

🔨 タスクの説明

  1. パイプライン内の flight_alerts_raw ノードに変換を追加します。

  2. アプリケーションの左上隅で、変換の名前を Preprocess flight_alerts とします。

  3. 次の変換を適用します:

    • 行名の正規化
    • 空白のトリミングカテゴリーに適用)
    • タイトルケースカテゴリーに適用)
    • キャスト flight_datedateにキャストし、M/d/yy を形式として使用します。
    • キャスト prioritystatusstringにキャストします。
    • アプリケーションの下部にあるデータセットプレビューウィンドウを使用して、タスクの概要のデータ問題が確かに解決されていることを確認します。
    • 画面の右側にある ⊕ パイプライン出力を追加 ボタンをクリックします。
    • 出力の名前を flight_alerts_preprocessed とします。
    • パイプラインを 保存 します。