5B. [Repositories] Code Repositories での共有ライブラリの公開と使用12 - クリーンな「乗客」出力データセットの作成、パート 1

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

12 - クリーンな「乗客」出力データセットの作成、パート 1

📖 タスクの概要

前のチュートリアル(Raw Files の作業)では、Datasource Project: Passengers プロジェクトと関連する passengers_logic コードリポジトリを作成し、これまでに一連の raw および preprocessed 乗客データセットを生成しました。このタスクでは、flight alerts データソースプロジェクトと同様に、clean 出力を作成する準備をします。

🔨 タスクの説明

  1. ユーザーの /Datasource Project: Passengers フォルダーを開き、passengers_logic リポジトリをクリックして開きます。
  2. Master から新しいブランチを作成し、それを ユーザー名/feature/clean_data と呼びます(例: jmeier/feature/clean_data)。
  3. 新しい共有クリーニングライブラリを使用するので、以前の演習で行った手順(ユーザーの flight_alerts_logic リポジトリ内)を使用して、クリーニングライブラリをリポジトリに追加します(ヒント:画面の左上側にある Libraries アイコンをクリックして開始します)。
  4. リポジトリの Files に戻り、/datasets ファイル(例: /transforms-python/src/myproject/datasets/)を右クリックし、New folder を選択します。
  5. 新しいフォルダーに clean と名付けます。