Introduction to Data Analysis in Foundry2 - 表形式データの定義
Warning

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

2 - 表形式のデータの定義

learn.palantir.com でも以下の内容をご覧いただけますが、アクセシビリティの観点から、ここに掲載しています。

Foundry のデータセットは、ユーザー定義のロジックで構築された行、列、スキーマ、および値のコレクションです。そのロジックが実行されると、業界のほとんどのデータプラットフォームで共通の表形式の構造を生成するために、いくつかのトランザクションタイプのうちの1つが実行されます。

裏側では、Foundry はデータセットをより小さなファイルに分割し、バッキングファイルシステムに保存します。データセットのビルドが実行されると(例えば、スケジュールによって)、入力(バッキングファイルシステム内の分割されたデータセットファイル)を組み立て、ユーザー定義のロジックをそれらに適用して出力を生成します。

📚 推薦文献(読むのに約5分)

Foundry データセットの構造についてのこの概要を読んでください。このチュートリアルの残りの部分では、これらの用語と概念に精通していることが前提となります。

分散データのアーキテクチャは、標準的なリレーショナルデータベーステーブルとは異なりますが、Foundry の分析アプリケーションではほとんどが抽象化されています。ただし、Foundry でデータセットがどのように構築されているかを一般的に把握しておくことで、分析のパフォーマンスを最適化することができ、データセットが最新の状態を保つ方法をより理解することができます。以下の画像を見て、Foundry のデータセットがトランザクションと複数の入力データセットを利用する方法を確認してください。

データセット A とデータセット B がトランザクションによって影響を受け、出力データセットファイルが作成されるアーキテクチャのフローチャート。