注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。
View は Foundry データセットビュー と似た動作をしますが、データを含むファイルは保持しません。代わりに、読み取るときに他のデータセット(元データセットとして知られる)の合成で構成されます。Viewsは元データセットを「指す」と考えることができます。Viewsは、プライマリキーを追加することでデータの重複排除を自動的に実行することもできます。Viewの元データセットに新しいデータが追加されると、重複排除後に最新のデータが利用できるようにするためにビルドが自動的にトリガーされます。Viewsは通常のデータセットのようにビルドされますが、実際にはデータが読み書きされないため、ほぼ瞬時に完了します。
一般的に、Viewsは通常のデータセットのように使用できます。ただし、Viewsは有効なトランスフォームの 出力 として指定することはできませんが、有効なトランスフォームの 入力 として指定することはできます。
Viewsの主な使用例には以下が含まれます:
新しいViewを作成するには、左のワークスペースナビゲーションパネルからFilesを開き、希望するプロジェクトまたはフォルダーを見つけます。そこに移動したら、右上のNew > Viewを選択して、現在のプロジェクトまたはフォルダー内に新しいViewを作成します:
Viewの名前と場所を選択し、設定を進めます。Viewが作成されると、元データセットが更新されるたびにViewを再ビルドするスケジュールが自動的に作成されます。作成または変更直後にViewを読み取りたい場合は、手動でViewをビルドする必要があります。
Viewは元データセットの合成で構成されるため、特定のViewのすべての元データセットは同じ列名とタイプを持っている必要があります(ただし、列の順序は異なる場合があります)。
Viewを構築するには、1つ以上の元データセットが必要です。初期設定後、Viewの元データセットはDetails > Dataset view settingsに移動して変更できます。
データの重複排除はViewの主要な機能であり、プライマリキーを追加することで有効にできます。プライマリキーが設定されると、Viewはプライマリキーの一意性が保証されます。Viewに存在する各プライマリキーは1つの行にのみ表示されます。プライマリキーを追加して、Viewを読み取る際に各プライマリキーの最新データのみが返されるようにします。この自動重複排除は、Viewの元データセットに不要な重複行が含まれている場合に特に便利です。
プライマリキーが設定されると、新しいViewを作成しない限り変更できません。
プライマリキーを追加するには、組み合わせてプライマリキーを形成する列を1つ以上選択します。これらの列にはnull値が含まれていてはいけません。
初期設定時にプライマリキーを追加しなかった場合は、後でDetails > Dataset view settingsに移動して追加できます。
プライマリキーを追加するには、重複するプライマリキーを解決するための列(または列の組み合わせ)も指定する必要があります。同じプライマリキーを持つ行の重複排除は、これらの列の値が最も高い行を保持し、他の行を削除することで行われます。これにより、Viewに表示される各プライマリキーが一意であることが保証されます。
オプションで、ブール値を含む削除列を指定することもできます。重複排除後、特定のプライマリキーに対して最終的に残る行に削除列がtrue
を含む場合、その行はViewから除外されます。
重複するプライマリキーは、削除列が行を除外する前に解決されます。したがって、特定のプライマリキーに対する「最新」の行の削除列の値のみが重要です。
重複排除と削除は、すべての元データセットにわたって実行されます:
重複排除と削除は、以下の組み合わせによって実装されます:
フィルターロジックは読み取り時に毎回評価されますが、プロジェクションが最新であり、Viewの元データセットが最後のプロジェクションビルド以降にAPPEND
またはUPDATE
トランザクションのみを持っている場合、このロジックの評価は実行時間と計算コストにほとんど影響しません。
このアーキテクチャを考慮して、以下のケースでのみプライマリキーの設定を持つViewを作成することをお勧めします。
APPEND
または厳密に加算的なUPDATE
トランザクションで更新されます。APPEND
または厳密に加算的なUPDATE
トランザクションで更新され、一部がSNAPSHOT
トランザクションで更新されますが、SNAPSHOT
トランザクションで更新されるものはまれにしかビルドされません。元データセットの更新がプロジェクションの完全な再ビルドを必要とする場合、プロジェクションの再ビルドが完了するまで、読者(Contour、トランスフォームジョブなど)がプロジェクションの恩恵を受けずにフィルターロジックを適用する必要があるため、かなりの計算コストが発生します。
Viewsは、通常のFoundryデータセットのようにFoundryに表示され、通常のデータセットが使用できる場所であればどこでも使用できます。唯一の例外は、Viewsは有効なトランスフォーム出力ではない(ただし有効なトランスフォーム入力ではある)ことと、軽量トランスフォームではサポートされていないことです。例として、複数のデータセットを効率的にユニオンし、プライマリキーを使用して結果のViewにデータの一意性を確保することが挙げられます。
ViewsはデータセットからOrganizationsの削除をサポートしていません。唯一サポートしているのはmandatory control Markingsの削除です。
Viewsでマーキングを削除する機能はユーザーのFoundryエンロールメントで有効になっていない場合があります。この機能を有効にするには、Palantir Supportに連絡してください。
Viewsを使用して、Viewの元データセット上のマーキングの伝播を停止できます。これを行うには、ViewのDetailsタブのDataset view settingsに移動し、Edit > Manage marking propagationを選択します。
Remove Marking
の権限を持つユーザーのみがマーキングの伝播を停止できます。マーキング伝播の変更は、元データセットに更新が発生したときに有効になります。
さらに詳しい情報については、マーキング削除のガイダンスを参照してください。