8. [Repositories] Ontology Data Pipelines8 - オントロジーデータソース準備ガイダンス
Warning

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

8 - オントロジーデータソースの準備ガイダンス

learn.palantir.com ↗でも以下の内容をご覧いただけますが、アクセシビリティの観点から、ここに掲載しています。

次のいくつかのタスクでは、Foundry のオントロジー管理アプリケーション(OMA)で基本的なオブジェクトタイプとリンクタイプを作成します。オブジェクトタイプは、通常、予定された、よくメンテナンスされたビルド(このトレーニングのルートで生成したものなど)のターゲット(つまり、出力)である Foundry データセットによって支えられます。

まず、オントロジーオブジェクトタイプを支えるデータセットを構築するためのベストプラクティスを見直し、パイプラインがこれらをどのように実装しているかをいくつか紹介します。

元データセットの最適なスキーマに関するガイダンスを見直すことから始めましょう。このドキュメンテーションを3-4分間見直し、仕事が頻繁に Foundry オントロジーへのデータの準備と同期を含む場合は、それをブックマークすることを検討してみてください。提案されたデータタイプと命名パターンに従うことで、オントロジー全体のパフォーマンスと一貫性が向上します。

次に、パイプラインの実行方法と、結果的にオントロジーの保守性に影響を与えるコード開発のベストプラクティスに戻りましょう。このドキュメンテーションページ(読むのに約8分)で、コードとパイプラインの衛生に関する一般的な推奨事項を見直します。

これらの推奨事項を見直した後、次のデータセットをオントロジーオブジェクトタイプを支えるためにより良く準備するための少なくとも3つの提案を考えることができますか?

最後に、オントロジー開発プロジェクトに取り組む前に、以下のことも知っておくべきです:

  • オブジェクトタイプとリンク、そして必要なデータアーキテクチャで達成したいワークフロー。
  • オブジェクトタイプは単一のデータセットによって支えられ、データセットは一つのオブジェクトタイプのみを支えることができます。
  • データ変換の段階で可能な限りクリーニングとフォーマットを行うべきであり、OMA やオントロジー対応アプリケーションでは行わないこと。
  • 主キーは常に一意であるべきですが、オントロジー元データセットでは特に重要です。
  • 元データセットのスキーマが変更された場合、オブジェクトタイプとリンクタイプがネガティブに影響を受けないように、アクションを取る必要があるかもしれません(これについては後で詳しく説明します)。