5B. [Repositories] Publishing and Using Shared Libraries in Code Repositories12 - クリーンな「乗客」出力データセットの作成、パート 1
Warning

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

12 - クリーンな「passengers」出力データセットの作成、パート 1

この内容は learn.palantir.com ↗ でもご覧いただけますが、アクセシビリティの観点から、ここに掲載しています。

📖 タスクの概要

前のチュートリアル(Raw Files の操作)では、Datasource Project: Passengers プロジェクトとそれに関連する passengers_logic コードリポジトリを作成し、これまでに一連の raw および preprocessed 乗客データセットを生成しました。このタスクでは、フライトアラートのデータソースプロジェクトと同様に、clean 出力を作成する準備をします。

🔨 タスクの説明

  1. ユーザーの /Datasource Project: Passengers フォルダーを開き、passengers_logic リポジトリをクリックして開きます。
  2. Master から新しいブランチを作成し、ユーザー名/feature/clean_data(例:jmeier/feature/clean_data)と呼びます。
  3. ユーザーの新しい共有クリーニングライブラリを使用するため、前の演習で行った手順(ユーザーの flight_alerts_logic リポジトリ内)を使って、クリーニングライブラリをリポジトリに追加します(ヒント:画面左上の Libraries アイコンをクリックして開始します)。
  4. リポジトリの Files に戻り、/datasets ファイル(例:/transforms-python/src/myproject/datasets/)を右クリックし、New folder を選択します。
  5. 新しいフォルダーに clean と名付けます。