注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。
ドキュメンテーションは常に重要です。Foundry のアプリケーションとデータパイプラインをサポートするプロジェクト構造は、ユーザーの現在と未来のチームに、データ変換に関する関連事項を伝えるための十分な機会を提供します。データを前処理した後は、それをクリーニングし、下流での使用のために準備する時期になりました。これは、厳密な変換構文だけでなく、途中のスコープとロジックを文書化することを意味します。
このチュートリアルでは、ユーザーのプロジェクトのための「クリーン」な出力をエンジニアリングし、下流のパイプラインとユースケースに消費させます。実装するコードは、データ入力を変換するための一般的な PySpark の機能を利用し、チュートリアルの大部分では、PySpark のベストプラクティスを詳述する選択されたドキュメンテーションエントリを探索することが求められます。ただし、PySpark の構文パターンを教えることは、このコースの範囲外であることを念のために述べておきます。