注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。
learn.palantir.com でも以下の内容をご覧いただけますが、アクセシビリティの観点から、ここに掲載しています。
ドキュメンテーションは常に行うべきです。データパイプラインをサポートする Foundry のアプリケーションやプロジェクト構造は、ユーザーの現在および将来のチームに、ユーザーのデータ変換に関する関連事実を知らせるための十分な機会を提供します。データを事前処理した後は、それをクリーニングして下流での使用のために準備します。これは、透明な変換構文を意味するだけでなく、途中のすべてのステップの範囲とロジックをドキュメンテーションすることを意味します。
このチュートリアルでは、ユーザーのプロジェクトのための「クリーン」な出力をエンジニアリングし、それを下流のパイプラインとユースケースが消費できるようにします。実装するコードは、データ入力を変換するための一般的な PySpark の機能を利用します。チュートリアルの大部分では、PySpark のベストプラクティスについて詳しく説明する選択されたドキュメンテーションエントリーを探索する必要があります。ただし、PySpark の構文パターンを教えることは、このコースの範囲外であることを思い出してください。