注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。
learn.palantir.com でも以下の内容をご覧いただけますが、アクセシビリティの観点から、ここに掲載しています。
ユーザーの passengers_raw
データは、組織内で広く利用する前に、いくつかのクリーニング手順が必要です。
dob
行を日付タイプに変換するflyer_status
行を正規化する現在 .../data/raw/
フォルダーにいます。 .../data/clean/
に進んでください。
passengers_datasource_clean
という新しいパイプライン作成物を追加します。
作成した2つのデータセットを .../raw/
フォルダーにインポートします。
passenger_flight_alerts_raw
はクリーニングが必要ありません。passenger_flight_alerts_clean
という出力を作成してください。
passengers_raw
の後に変換ステップを追加し、以下のロジックを適用します(必要に応じて、以下の画像を参考にしてください):
dob
行を date タイプに変換する前に、文字列の連結 を使用して "19" を年に追加する_error
および _file
行を Drop するflyer_status
行に Title Case 変換を適用するステップ5では、まず、最初のスクリーンショットに示すように、文字列の連結 を使用して "19" を年に追加し、dob
行をクリーニングします。これにより、2つ目のスクリーンショットに示す CAST およびその他のクリーンアップが準備されます。
5a:
5b:
変換ノードの名前を Clean Passengers にします。
変換から passengers_clean
という出力を作成します。
グラフ上のノードに希望する色を付けます。
パイプラインを保存し、デプロイします。