8. [Repositories] オントロジーデータパイプライン12 - パイプラインのドキュメンテーションと更新

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

12 - パイプラインのドキュメンテーションと更新

📖 タスクの概要

なぜ、手付かずのデータセットの clean バージョンをオントロジーの入力として直接使用しなかったのですか?

Clean データセットは、Foundry での多くの活動、分析、モデリング、その他のデータパイプラインなどの起点となります。これらは通常、 raw データに密接に似ているため、オントロジーオブジェクトとリンクタイプに必要なものよりも多くの行を含む可能性がありますが、これらの他のワークフローには非常に価値があります。また、最終的には新たな派生行をオントロジーを利用した元データセットに追加することを決定し、その変更を clean バージョンに影響を与えずに行いたいかもしれません。この中間的な変換ステップ( cleanontology )は、初めて形式的に感じる場合でも常に推奨されます。

ユーザーのパイプラインには、ドキュメンテーションを作成し、スケジュールを設定し、このトレーニングのルートで学んだ方法に従って監視するべき変換ステップが追加されました。これらのまとめた推奨事項に従って知識をテストしてみてください。

🔨 タスクの説明

  1. ビルドが完了したら、リポジトリの上部中央にある データフローを探索 ボタンをクリックします。
  2. データセットを展開してすべての祖先ノードを表示し、それらを論理的に配置します(ヒント:すべてのノードを選択して ctrl+l をクリックしてみてください)。
  3. このデータフローのグラフを /Ontology Project: Flight Alerts/documentation/ に保存します。

  1. ユーザーの他のリポジトリのそれらを反映する構造の README ファイルをリポジトリに追加します。所有者情報や説明を追加することを検討してみてください。これは前のチュートリアルの タスクの概要 セクション "プロジェクトの出力を作成" セクション "パイプラインのドキュメンテーションの追加" から抽出することが可能です。

  1. データフローのグラフで、スケジュール ヘルパーを開き、Flight AlertsPassengers のスケジュールを編集して、ターゲットが以前に設定された clean データセットではなく、新しい ontology データセットになるようにします。

  1. 以下のヘルスチェックをユーザーの新しいオントロジーデータセットそれぞれに適用し、それらを関連するチェックグループに追加します:

オブジェクトとリンクタイプをオントロジーで設定した後に最終的なチェックを追加します。これらの新しいデータセットはすべて、既存の スケジュールステータススケジュール期間 のチェックに自動的に追加されます。