8. [Builder] オントロジーデータパイプライン1 - このコースについて

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

1 - このコースについて

Foundry オントロジーは、組織にとって重要なエンティティ、イベント、プロセスの「デジタルツイン」です。このセマンティックオブジェクトレイヤーは、ユーザーやユーザーの同僚が操作可能で相互運用可能なアプリケーションを構築するために使用できる一貫した API を提供します。以下の Data Lineage の画像では、Foundry オントロジー内の [Example Data] Flight オブジェクトタイプが、少なくとも2つの操作アプリケーション(Data Lineage では「モジュール」とラベル付けされています)で使用され、航空機やフライトアラートなどの他のオブジェクトタイプにリンクしていることが見て取れます。

このグラフはまた、[Example Data] Flight オブジェクトタイプがデータセットに「バック」されていて、これはスケジュールされたビルドの出力であることを示しています。このフローは、このチュートリアルの中心テーマを示しています:データエンジニアは、アプリケーションビルダーの同僚と密接に協力して、Foundry オントロジーのオブジェクトとリンクの基礎となるパイプラインとデータセットを作成する必要があります。

⚠️ コースの前提条件

  • DATAENG 07: データ期待値の設定: このトラックの前のコースをまだ完了していない場合、今すぐ行ってください。
  • ユーザーの組織のオントロジーを編集するための必要な権限。認可が必要な場合は、プログラム管理者または Palantir サポートに連絡してください。

アウトカム

データパイプラインは孤立した作成物ではありません。常に何かの目的のために構築されます。このトレーニングでは、パイプラインの目的は、リンクしたオントロジーオブジェクトタイプのバックアップとなるデータセットを準備することです。ユーザーは、オントロジーを設定し、パイプラインを更新して元データセットを最適化し、それをユーザーのオントロジーの形状を変更する可能性のある上流のデータ変更に対してレジリエントにするための実践的な練習を行います。最後に、一連の演習が一般的なトラブルシューティングの手順を歩いて行きます。

学習の目的

  1. コアオントロジーの概念、基本的なユースケース、設計上の決定を理解する。
  2. Object Explorer でオブジェクトタイプを検索し、フィルター処理する。
  3. Ontology Manager で新しいオブジェクトタイプとリンクタイプを作成する方法を知る。
  4. ベストプラクティスに従って、オントロジーで使用するための元データセットを最適化する。
  5. パイプラインにチェックを適用して、オブジェクトタイプが上流のデータ変更に対してレジリエントであることを確認する。
  6. オントロジーストレージと取得アーキテクチャを理解する。
  7. "書き戻し"とそのデータパイプラインにおける位置についての経験に基づく理解を深める。
  8. オントロジーの同期問題の一般的なトラブルシューティングを練習する。

💪 Foundry のスキル

  • Object Explorer を使用して、オントロジーを検索、フィルター処理し、一般的に理解する。
  • Ontology Manager を使用して、オントロジーオブジェクトタイプとリンクタイプを作成および編集する。
  • パイプラインの変換を更新して、元データセットをオントロジーバックエンドとの同期に最適化する。
  • "書き戻し"データセットを作成し、それらをユーザーのデータパイプラインに配置する。
  • オントロジーマネージメントアプリケーションのオブジェクトストレージインターフェースを通じて、加算および破壊的なスキーマ変更に対応する。