注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

オントロジー クエリを使用したコンピュート使用

Foundry オントロジーは、ファイルベースのデータを組織中心のオブジェクトにマッピングし、データ探索、データ分析、運用データ編集、シナリオ分析などのための高速クエリを提供するデータバックエンドです。オントロジーは、各自の目的を持つマルチモーダルストレージバックエンドにデータを保存し、単一のリクエストで柔軟にクエリを実行できます。Foundry オントロジーをクエリするには、以下で説明する基本的な概念の知識が必要です。

Palantir とのエンタープライズ契約がある場合は、コンピュート使用計算を進める前に Palantir の担当者に連絡してください。

基本概念: オブジェクトタイプとオブジェクトセット

最初の重要な概念は、オブジェクトタイプとそれに対応するオブジェクトセットの違いです。オブジェクトタイプは、エンティティ自体のセマンティックな表現(オブジェクトの名前やプロパティなど)です。

オブジェクトタイプには対応するオブジェクトセットがあり、そこにはオブジェクト自体が含まれています。オブジェクトセットのサイズは、インカミングデータセットの行数とオントロジーアクションによって作成および削除されたオブジェクトの数に対応します。

基本概念: クエリタイプ

次に重要な概念は、クエリタイプの概念です。これにはフィルター処理、集計、Search Around、書き戻し操作が含まれます。各クエリタイプの実行にはコンピュートが必要です。

  • フィルター処理は、完全なオブジェクトセットを考慮し、フィルタリング基準を適用して小さな出力セットを生成します。
  • 集計は、入力オブジェクトセットを取得し、セット内のすべてのオブジェクトの1つのプロパティに対して集計関数(sumavgなど)を実行します。
  • Search Around は、インカミングオブジェクトセットを取得し、インカミングセットの特定のプロパティに基づいて別のオブジェクトセットに対して二次フィルターを実行します。
  • 書き戻し操作は、指定されたオブジェクトセットのオブジェクトのプロパティの値を置き換えます。

クエリタイプについてさらに学ぶには、APIドキュメントを参照してください。

Foundry オントロジーを使用する場合、クエリタイプは次の Foundry アプリケーション によってオブジェクトセットに対して実行されます。

  • Object Explorer
  • Workshop
  • Quiver
  • Slate
  • Vertex
  • Foundry Rules
  • Foundry Machinery
  • Object APIs (OPIs)

これらのソースからオントロジーをクエリするには、次のようにクエリを実行するためのコンピュート秒を使用します。

  • クエリオーバーヘッドのための固定された最小限のコンピュート秒。
  • クエリをサービスするために使用されるコンピュート量によって測定される追加のスケーリングコンピュート秒。

オントロジーオブジェクトクエリを使用した Foundry コンピュートの測定

Object Storage V1 を使用したコンピュートの測定

Object Storage V1 (Phonograph) は、耐久性のある水平スケーラブルなクラスター内の分散インデックスセットにデータを保存します。これらのインデックス内で、データはオントロジークエリエンジンによってトラバースされる大規模なデータ構造に格納されます。クエリが実行されると、エンジンはインデックスをトラバースすることで検索中に大量のデータの処理を回避できます。このプロセスは「プルーニング」として知られています。

このエンジンを使用すると、最大 1000 倍少ないレコードを評価して数十億のレコードを検索できます。レコードの各物理的な評価を「ヒット」と呼びます。Object Storage V1 は、各クエリでのヒット数を最小限に抑えるように設計されています。

Object Storage V2 を使用したコンピュートの測定

Object Storage V2 (OSv2) は、高速インデックス作成、Search Around、および書き戻しのために Palantir によって最適化された強化インデックス形式でオブジェクトを保存し、複雑なタスクを実行するために複数のコンピュートバックエンドへのスムーズなハンドオフをサポートします。これには、クエリの一部として完全に並列化された Spark コンピュートの組み合わせが含まれます。

Object Storage V2 も効率的なインデックス構造を使用しているため、基本的なクエリについては Object Storage V1 のヒットの原理が適用されます。ただし、クエリの一部としてスピンアップされるオンデマンド Spark コンテナによってもコンピュート秒が使用される場合があります。

Object Storage V2 バックエンドのオブジェクトに対して行われたクエリは、以下のパターンでコンピュートを使用します。

  • Object Storage V1 バックエンドのオブジェクトに対するクエリごとに 16 コンピュート秒の固定オーバーヘッド。
  • Object Storage V2 バックエンドのオブジェクトに対するクエリごとに 4 コンピュート秒の固定オーバーヘッド。Object Storage V2 の最適化された構造により、Object Storage V1 よりもオーバーヘッドが少なくなるため、固定コンピュート秒のオーバーヘッドが減少します。
  • クエリのプルーニングプロセスを通じて計算作業を行うときに追加のコンピュート秒が必要です。追加のコンピュート秒は、インデックス内のオブジェクトの数およびクエリの種類に応じてスケーリングします。
  • Object Storage V2 (OSv2) では、インデックスプルーニングでも追加のコンピュート秒が必要です。ただし、OSv2 は、10 万以上のオブジェクトに対して Search Around を実行する場合や、1 回のリクエストで 1 万以上のオブジェクトに対して書き戻し操作を実行する場合に、オンデマンド Spark クラスター検索もサポートします。これらの Spark クラスターは、プラットフォーム上の他のすべての Spark ベースのアプリケーションと同じ方法で使用を利用します。説明については、並列化されたコンピュートのドキュメントを参照してください。
  • オントロジーへの書き戻しを伴うアクションには最小限のオーバーヘッドがあります。各アクションには 18 コンピュート秒のオーバーヘッドがあります。アクションは、書き戻しリクエストで編集されるオブジェクトの数に応じてスケーリングし、最初のオブジェクトインスタンスを超えて編集されたオブジェクトインスタンスごとに追加の 1 コンピュート秒が発生します。
  • Functions on Objects を介して実行される関数には最小限のオーバーヘッドがあります。具体的には、各関数実行には 4 コンピュート秒の固定オーバーヘッドがあります。

以下の表は、クエリタイプごとの最小コンピュート秒使用をまとめたものです。

クエリタイプ最小コンピュート秒
オントロジー V1 クエリ16
オントロジー V2 クエリ4
オブジェクトのアクション18
オブジェクトの関数4

オントロジークエリを使用した Foundry コンピュート使用のドライバーの理解

  • 非常に単純なルールとして、クエリごとの固定コンピュート使用はクエリの数に比例して増加します。クエリの数が少ないほど、全体のコンピュート使用量は少なくなります。
  • オブジェクトセットサービスへの複雑なクエリ(たとえば、一般的なマルチオブジェクト検索など)は、各オブジェクトタイプに対して複数のサブクエリを開始します。クエリの数を減らすために、検索を個々のオブジェクトタイプに制限してください。
  • 小規模なオブジェクトセットに対するクエリは、大規模なオブジェクトセットに対するクエリよりも少ないコンピュートを使用します。クエリ内のヒットの数はクエリされるオブジェクトセットのサイズに比例します。
  • 他の操作を実行する前にフィルター処理を行うことで、高度にインデックス化されたバックエンド構造を利用できます。これにより、クエリ内のヒットの数が減少し、全体のコンピュート使用量が削減されます。これは特に集計や Search Around で重要です。フィルター処理されたオブジェクトセットは、完全なオブジェクトセットよりも少ないコンピュートで処理できます。

オントロジークエリからの Foundry コンピュート使用の調査

Foundry では、コンピュート秒はリソースに対してではなく、それらのリソースと対話しているユーザーに対して割り当てられます。

オントロジークエリに関しては、コンピュートが割り当てられる方法はいくつかあります。一般的なルールとして、コンピュートはクエリが発生したリソースにアタッチされます。ただし、(API 経由など)コンピュートを生成するために使用される保存されたリソースがない場合、コンピュートはクエリされるオブジェクトタイプにアタッチされます。単一のリクエストで複数のオブジェクトがクエリされた場合、コンピュートはオブジェクト間で均等に分割されます。

次のリソースタイプには、基礎となるオブジェクトではなく、オントロジークエリコンピュートが割り当てられます。

  • Workshop アプリケーション
  • Carbon ページ
  • Quiver 分析およびダッシュボード
  • Vertex アプリケーション
  • Slate アプリケーション
  • Foundry Machinery アプリケーション
  • Foundry Rules リソース
  • Foundry Automate
  • AIP Logic

次のインタラクションパターンでは、設定されたリソースがないため、オントロジークエリコンピュートが直接クエリされるオブジェクトタイプにアタッチされます。

  • Object Explorer
  • Object APIs(OSDK を含む)