Warning

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

Code Repositories での計算使用量

Code Repositories でビルドを実行するには、Foundry の計算リソースが必要で、これはコンピュート秒で測定されます。本ドキュメントでは、ビルドが計算をどのように使用し、製品内での計算使用量の調査と管理に関する情報を提供します。

一つ以上のデータセットトランスフォームビルドを実行すると、Foundry はトランスフォームのロジックをそのサーバーレス計算クラスターに引き出し、コードを実行します。ビルドの長さとサイズは、コードの複雑さ、入力と出力のデータセットのサイズ、そしてコードに設定されたSpark の計算プロファイルによって決まります。

入力データセット上でのコードの実行には、Foundry の計算リソース(Foundry のコンピュート秒で測定)が必要で、トランスフォームの結果が Foundry のストレージに書き込まれる場合には Foundry のストレージが必要です。コードの作成行為自体は計算使用量を発生させません。データセットのビルドのみが計算使用量を発生させます。

Foundry 計算の測定

Code Repositories を支えるトランスフォームエンジンは、バックエンドで並列計算を使用し、最も一般的には、Spark のスケーラブルな計算フレームワークで使用されます。Code Repositories のトランスフォームは、ジョブの実行時間中に使用される Foundry のコンピュート秒の総数で測定されます。これらのコンピュート秒は、ジョブの全期間中に測定され、入力データセットの読み取り、コードの実行(I/O の待機などの操作を含む)、および出力データセットの Foundry への書き戻しにかかった時間を含みます。

トランスフォームは並列計算を利用するように設定できます。コンピュート秒は計算実行時間の尺度であり、壁時計時間ではないため、並列トランスフォームは壁時計秒あたり複数のコンピュート秒を発生させます。Code Repositories のジョブに対する並列計算の測定方法については、以下の例をご覧ください。

Foundry の使用料を支払う際には、デフォルトの使用料率は以下の通りです:

vCPU / GPU使用率
vCPU1
T4 GPU1.2

もし Palantir とエンタープライズ契約を結んでいる場合は、計算使用量の計算を進める前に、Palantir の代表者に連絡してください。

Code Repositories からの Foundry 計算使用量の調査

使用量情報はリソース管理アプリケーションで確認でき、使用量メトリクスの詳細な分析が可能です。

ビルドが Foundry の計算使用量の主要な要因である一方、その使用量はそれに関連付けられた長期リソースに対して記録されます。データセットのトランスフォームの場合、リソースはジョブによって具体化されるデータセット(またはデータセットのセット)です。データセットの詳細タブのリソース使用量メトリクスの下でデータセットの使用量のタイムラインを見ることができます。

複数の出力データセットを生成するトランスフォームでは、計算使用量はすべてのデータセット間で均等に分散されます。例えば、トランスフォームジョブが二つのデータセットを作成し、一つは五行、もう一つは五百万行の場合、Foundry のコンピュート秒の数は二つの間で均等に分散されます。

Foundry 計算使用量の要因の理解

キャンセルされない限り、Code Repositories のトランスフォームは、すべてのロジックがすべてのデータに対して実行され、出力が Foundry に書き戻されるまで実行されます。この実行時間に影響を与える主要な要素は、(1)入力データのサイズと(2)トランスフォームロジックによって行われる計算操作の複雑さです。

  • 同じロジックを持つジョブであれば、入力データサイズが大きいジョブは、小さいジョブよりも多くの計算を必要とします。例えば、100GB のデータに対して列処理を行うジョブは、同じ処理を 10GB のデータに対して行うジョブよりも多くの Foundry コンピュート秒を使用します。
  • データに対して複雑な操作を多く行うジョブは、比較的少ない操作を行うジョブよりも多くの計算を必要とします。これは時々 "ジョブの複雑さ"と呼ばれます。
    • 基本的な例として、5 * 55!の二つの数学的操作の間の操作数を考えてみてください。5 * 5は一つの乗算操作です。5!5 * 4 * 3 * 2 *1(四つの乗算操作)と等価で、5 * 5の例の二倍の複雑さです。ジョブが集約、結合、または機械学習アルゴリズムなどのタスクで複雑になるにつれて、ジョブがデータ上で完了しなければならない操作の数は増える可能性があります。

Code Repositories と Foundry 計算使用量の管理

各ジョブについて、ジョブのパフォーマンスと計算使用量を推進した基礎となる計算メトリクスをレビューすることができます。詳細については、Spark の詳細の理解を参照してください。

ジョブでは、Foundry のコンピュート秒は、並列化されたエグゼキュータのサイズと数によって決まります。これらの設定は、ジョブごとに完全に設定可能です。この設定方法については、Spark の計算プロファイルのドキュメントを参照してください。エグゼキュータのサイズは、そのメモリと vCPU の数によって制御されます。エグゼキュータあたりの vCPU の増加とメモリの増加は、そのエグゼキュータが発生させるコンピュート秒を増加させます。

同時に実行されるタスクの数は、設定されたエグゼキュータの数とそれに対応する vCPU の数によって決まります。設定上書きが指定されていない場合、トランスフォームはデフォルトの Spark プロファイルを使用します。結果として得られるデータセットの Foundry ストレージは、作成されるデータセットのサイズによって決まります。

最終的には、異なるロジックを持つジョブでも、非常に異なる数の操作で同じ結果を達成することができます。

使用量の管理のためのコードの最適化

ジョブが使用するコンピュート秒を管理するために、コードを最適化する方法はいくつかあります。このセクションでは、一般的に使用される最適化手法に関する詳細情報へのリンクを提供します。

  • Spark は、Foundry がコードリポジトリのバッチ計算の大部分に採用している分散クラスター計算フレームワークで、様々な最適化手法を可能にします。Spark の最適化について詳しく学ぶ。
  • Spark では、ビルドを迅速化するために、パーティショニングを最適化することができます。最適なパーティション数は、行数、列数、列のタイプ、内容によって異なります。データセットサイズの 128 MB あたり一つのパーティションの比率を推奨します。
  • インクリメンタル計算は、出力データセットを生成するためにトランスフォームを行う効率的な方法です。トランスフォームのビルド履歴を活用することで、インクリメンタル計算は、トランスフォームが実行されるたびに出力データセット全体を再計算する必要がなくなります。
  • 特に小〜中規模のデータセットについては、Spark 以外にもいくつかの計算エンジンがあり、これらはシングルノードアプリケーションのベンチマークで常に Spark を上回るパフォーマンスを示します。したがって、これらの代替手段を使用してパイプラインを実行すると、処理速度が向上し、計算消費が削減される可能性があります。これらのオプションを最大限に活用するためには、ライトウェイトトランスフォームについて理解することをお勧めします。
  • ビルドがSchedulesを使用してオーケストレーションされている場合、コストを最適化するためのスケジューリングのベストプラクティスを読むことをおすすめします。

Foundry 計算使用量の計算

使用例 1: 標準メモリ

この例では、標準メモリ要求を持つ静的に割り当てられたジョブの Foundry 計算の測定方法を示しています。

ドライバープロファイル:
    vCPUs: 1
    GiB_RAM: 6
実行者プロファイル:
    vCPUs: 1
    GiB_RAM: 6
    Count: 4
全ジョブの壁時計ランタイム: 
    120秒



計算
driver_compute_seconds = max(num_vcpu, GiB_RAM/7.5) * num_seconds
                       = max(1vcpu, 6gib/7.5gib) * 120sec
                       = 120 コンピュート秒
                       
# ドライバーの計算秒数は最大のVCPU数とRAMサイズを7.5で割った値を比較し、それを秒数で掛けたものとなります。この例では1VCPUと6GiBのRAMを7.5で割った値を比較し、それを120秒で掛けています。結果は120コンピュート秒です。

executor_compute_seconds = num_executors * max(num_vcpu, GiB_RAM/7.5) * num_seconds 
                         = 4 * max(1, 6/7.5) * 120sec 
                         = 480 コンピュート秒
                         
# 実行者の計算秒数は、実行者の数と最大のVCPU数とRAMサイズを7.5で割った値を比較し、それを秒数で掛けたものとなります。この例では、実行者の数4と1VCPUと6GiBのRAMを7.5で割った値を比較し、それを120秒で掛けています。結果は480コンピュート秒です。

total_compute_seconds = 120 + 480 = 600 コンピュート秒 

# トータルの計算秒数は、ドライバーの計算秒数と実行者の計算秒数を足したものとなります。この例では、120コンピュート秒と480コンピュート秒を足して、トータルは600コンピュート秒となります。

使用例 2:大容量メモリ

この例では、大容量メモリ要求を持つ静的に割り当てられたジョブの Foundry Compute の計測方法を示しています。

ドライバープロファイル:
    vCPUs:2
    GiB_RAM:6
エクゼキュータープロファイル:
    vCPUs:1
    GiB_RAM:15
    数:4
合計ジョブ実行時間:
    120秒

計算:
# ドライバーの計算秒数 = max(VCPUの数, RAM/7.5) * 秒数
driver_compute_seconds = max(num_vcpu, GiB_RAM/7.5) * num_seconds
                       = max(2vcpu, 6gib/7.5gib) * 120sec
                       = 240 計算秒

# エクゼキュータの計算秒数 = エクゼキュータの数 * max(VCPUの数, RAM/7.5) * 秒数 
executor_compute_seconds = num_executors * max(num_vcpu, GiB_RAM/7.5) * num_seconds 
                         = 4 * max(1, 15/7.5) * 120sec 
                         = 960 計算秒

# 合計計算秒数 = ドライバーの計算秒数 + エクゼキュータの計算秒数
total_compute_seconds = driver_compute_seconds + executor_compute_seconds
                      = 240 + 960 = 1200 計算秒

使用例3:ダイナミックなエグゼキュータ数

この例では、一部のジョブ実行時間が2つのエグゼキュータで行われ、残りのジョブ時間が4つのエグゼキュータで行われる動的に割り当てられたジョブに対して、Foundry Computeがどのように測定されるかを示しています。

ドライバープロフィール:
    vCPUs:2
    GiB_RAM:6
エグゼキュータプロフィール:
    vCPUs:1
    GiB_RAM:6
    数量: 
        最小:2
        最大:4
全ジョブの壁時計ランタイム: 
    120秒:
        2エグゼキュータ:60秒
        4エグゼキュータ:60秒



計算:
driver_compute_seconds = max(num_vcpu, GiB_RAM/7.5) * num_seconds
                       = max(2vcpu, 6gib/7.5gib) * 120sec
                       = 240 compute-seconds
                       
# 2エグゼキュータでのジョブ時間の計算秒を計算する
2_executor_compute_seconds = num_executors * max(num_vcpu, GiB_RAM/7.5) * num_seconds 
                           = 2 * max(1, 6/7.5) * 60sec 
                           = 120 compute-seconds 

# 4エグゼキュータでのジョブ時間の計算秒を計算する
4_executor_compute_seconds = num_executors * max(num_vcpu, GiB_RAM/7.5) * num_seconds 
                           = 4 * max(1, 6/7.5) * 60sec 
                           = 240 compute-seconds
                         

total_compute_seconds = driver_compute_seconds + 2_executor_compute_seconds + 4_executor_compute_seconds
                      = 240 + 120 + 240 = 600 compute-seconds

利用例 4: GPU コンピュート

この例では、静的に割り当てられたジョブの Foundry GPU コンピュートがどのように測定されるかを示しています。

ドライバープロファイル:
    T4 GPU: 1
エグゼキュータプロファイル:
    T4 GPU: 1
    数量:4
合計ジョブ実行時間: 
    120秒


計算:
driver_compute_seconds = num_gpu * gpu_usage_rate * num_seconds
                       = 1gpu * 1.2 * 120秒
                       = 144 コンピュート秒

executor_compute_seconds = num_executors * num_gpu * gpu_usage_rate * num_seconds 
                         = 4 * 1 * 1.2 * 120秒 
                         = 576 コンピュート秒

total_compute_seconds = 144 + 576 = 720 コンピュート秒 

このコードでは、データ処理のためのGPU使用時間を計算しています。driver_compute_secondsはドライバーのGPU使用時間を表し、executor_compute_secondsはエグゼキュータのGPU使用時間を表します。最後に、これらの合計時間をtotal_compute_secondsで計算しています。