3. [Builder] プロジェクト出力の作成2 - クリーニング・パイプラインの作成

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

2 - クリーニング・パイプラインの作成

📖 タスクの概要

現在、準備変換の初期段階のシーケンスを持っています:生データ → 「ローカル」生データのコピー → 前処理済み。 このチュートリアルで作成する出力は、パイプラインの次の段階への入力として機能します。 この最初のタスクでは、パイプラインのクリーンセグメントを作成します。

🔨 タスクの説明

  1. 前のチュートリアルで作成した Datasource プロジェクトのフォルダーに進む。例:.../Temporary Training Artifacts/${yourName}/Data Engineering Tutorials/Datasource Project: Flight Alerts/
  2. バッチパイプラインに flight_alerts_datasource_clean という名前を付ける。
  3. /preprocessed フォルダーから3つのデータセットを追加する。
  4. オプションで、3つの前処理済みノードに色とラベルを適用する。