注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。
パイプラインの各段階でコードの管理と効率的な使用に注意を払うことで、保守性が大幅に向上します。データセットと行名の一貫性を保つことで、組織内の他のメンバーが変換コードを理解しやすくなり、出力が他のデータ資産と簡単に結合できるようになります。ユーザー定義関数(例:クリーニングやフォーマット用)が必要な場合は、一度書いてインポートステートメントで参照することで、コードベースがすっきりし、理解しやすくなります。
このチュートリアルでは、以下を行いました:
以下は、このトレーニングの過程で使用された製品ドキュメントのリストです:
パイプラインの前処理段階では、データセットが組織全体で広く使用できるデータセットを生成するより実質的でポリシーベースのクリーニングステップに備えて準備されます。次のチュートリアルでは、パイプラインをクリーニングフェーズに移行するだけでなく、Foundry でデータを変換するための新しいベストプラクティスとテクニックを紹介します。