3. [Builder] Creating a Project Output2 - クリーニング・パイプラインの作成
Warning

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

2 - ユーザーのクリーニングパイプラインを作成する

learn.palantir.com ↗ でも以下の内容をご覧いただけますが、アクセシビリティの観点から、ここに掲載しています。

📖 タスクの概要

現在、初期段階の準備変換シーケンスを持っています:原始ソース → 「ローカル」の原始コピー → 前処理済み。このチュートリアルで作成する出力は、パイプラインの次の段階への入力として機能します。この最初のタスクでは、パイプラインのクリーンセグメントを作成します。

🔨 タスクの説明

  1. 前のチュートリアルで作成したDatasourceプロジェクトフォルダーに進みます。例:.../Temporary Training Artifacts/${yourName}/Data Engineering Tutorials/Datasource Project: Flight Alerts/
  2. バッチパイプラインに flight_alerts_datasource_clean と命名します。
  3. ユーザーの /preprocessed フォルダーから3つのデータセットを追加します。
  4. 必要に応じて、3つの前処理済みノードに色とラベルを適用します。