8. [Builder] オントロジーデータパイプライン8 - オントロジー データソース 準備ガイダンス

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

8 - オントロジー データソース 準備ガイダンス

次のいくつかのタスクで、Foundry のオントロジー管理アプリケーション(OMA)で基本的なオブジェクトタイプとリンクタイプを作成します。オブジェクトタイプは、通常、スケジュールされた、よく管理されたビルドのターゲット(つまり、出力)である Foundry データセットによって支えられています。これは、このトレーニングのルートで生成したものと同様です。

まず、オントロジーのオブジェクトタイプを支えるデータセットを構築するためのベストプラクティスを確認し、パイプラインがこれらをどのように実装しているかをいくつか紹介します。

まず、元データセットの最適なスキーマに関するガイダンスを確認しましょう。このドキュメントを3〜4分間見直し、Foundry オントロジーにデータを準備して同期する作業が頻繁に含まれる場合は、ブックマークを検討してください。提案されたデータタイプと命名パターンに従うことで、オントロジー全体のパフォーマンスと整合性が向上します。

次に、パイプラインの実行方法と、その結果、オントロジーの保守性に影響を与えるコード開発のベストプラクティスに戻りましょう。このドキュメントページ(約8分間の読み物)で、コードとパイプラインの衛生に関する一般的な推奨事項を見直します。

これらの推奨事項を見直した後、以下のデータセットをオントロジーのオブジェクトタイプを支えるようにより適切に準備するための少なくとも3つの提案を考えることができますか?

最後に、オントロジー開発プロジェクトに取り組む前に、以下のことを知っておくべきです。

  • オブジェクトタイプとリンクを使用して達成することを目指すワークフローと、必要なデータアーキテクチャ。
  • オブジェクトタイプは単一のデータセットによって支えられており、データセットは1つのオブジェクトタイプだけを支えることができます。
  • 可能な場合、OMA やオントロジー対応アプリケーションではなく、データ変換の上流でクリーニングや整形を行う必要があります。
  • 主キーは常に一意であるべきですが、オントロジーの元データセットには特に重要です。
  • 元データセットのスキーマが変更された場合、オブジェクトタイプやリンクタイプが悪影響を受けないように対処する必要があるかもしれません(これについては後述)。