ドキュメントの検索
karat

+

K

APIリファレンス ↗
データ統合パイプラインの最適化とビルドデータセットプロジェクションプロジェクションの設定
Feedback

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

プロジェクションの設定

以下の情報は、データセットのプロジェクションを有効にし、設定し、構築するプロセスをガイドします。

Noho はデータセットのプロジェクションを管理するサービスです。

ユーザーのデータセットに対してプロジェクションを有効にする

プロジェクションは、データセットのスキーマに noho: true を設定することで有効になります。

変換からデータセットを書き込む際や、Details タブでスキーマを手動で修正することで、データセットのスキーマを設定できます。

Copied!
1 2 3 4 5 6 7 8 9 10 11 12 13 14 from transforms.api import transform, Input, Output @transform( # 出力データセットのパスを指定します output_dataset=Output('/examples/example_output'), # 入力データセットのパスを指定します input_dataset=Input('/examples/example_input'), ) def compute(output_dataset, input_dataset): # 入力データセットをデータフレームに変換します input_dataset = input_dataset.dataframe() # 変換したデータフレームを出力データセットに書き込みます。オプションで"noho"を"true"に設定します output_dataset.write_dataframe(input_dataset, options={"noho": "true"})
データセットのスキーマでプロジェクションを有効化します。

プロジェクションタブへ移動

データセットを表示しているときに、スキーマで noho: true が設定されていて、データセットの編集権限がある場合、プロジェクションタブが表示されます。

データセットプレビューのプロジェクションタブへ移動します。

作成ダイアログを開く

新しいプロジェクションを追加を選択します。

プロジェクションタブで新しいプロジェクションを追加します。

プロジェクションの行を選択

プロジェクションに含める行を選択します。

すべての行を追加するか、特定の行のみを追加するか、除外する行を選択します。

ほとんどの場合、すべての行が適しています。しかし、クエリが行のサブセットのみを選択することがわかっている場合、この設定を調整することができます。

プロジェクションのタイプを選択

プロジェクションのタイプを選択します。

プロジェクションでフィルタリングまたは結合を最適化するかどうかを選択します。

  • フィルター処理する最適化されたプロジェクションの場合、フィルター処理する行を選択します。
    • 順序は重要で、プロジェクションはこのリストのプレフィックスに対するクエリの速度を上げるだけです。
  • 結合最適化されたプロジェクションの場合、結合する行とバケット数を選択します。
    • 結合はこの行の正確なセットに対してのみ速度が上がります。
    • 明示的にバケット化されたデータセットや他の結合最適化されたデータセットに結合する場合、バケット数は 等しくなければなりません。

プロジェクションを作成

プロジェクションを作成ボタンを選択します。

プロジェクションはすべての行を選択し、データセットの column1 をフィルター処理する最適化を行います。

プロジェクションは現在存在しますが、データは含まれていません。これは、プロジェクションの隣にある赤い警告アイコンで表示されます。プロジェクションをクエリで使用するには、次のステップに従って最初に構築する必要があります。

ビルドの設定

リソース使用量をより細かく制御するために、プロジェクションを維持する内部ビルドは自動的にスケジュールされません。明示的に設定する必要があります。

まず、スイッチ 現在のブランチでのプロジェクションビルドを有効化を切り替えます。これにより、現在のブランチでビルドを実行することができます。

次に、ビルドのスケジュールを設定します。別のブランチでビルドをスケジュールしたい場合、そのブランチに移動してプロセスを繰り返す必要があります。

現在のブランチでプロジェクションビルドを有効化するためのスイッチを切り替えます。

ビルドセクションでビルドスケジュールを追加するかどうかを選択します。

ビルドは毎日午前12時31分(東部標準時)にスケジュールされています。

(オプション)プロジェクションをビルド

ビルドを待つことができない場合、ビルドボタンを選択してプロジェクションを明示的にビルドします。

手動でプロジェクションビルドをトリガーするために、ビルドセクションの上にあるハンマーのシンボルを選択します。

ビルドが完了するのを待ちます。プロジェクションが最新の状態になる前に、複数のビルドが実行されるかもしれません。プロジェクションビルドステータスの行の隣にある緑のチェックマークは、プロジェクションが完全に最新の状態であることを示します。

プロジェクションが成功裏にビルドされ、緑のチェックマークが表示されています。

プロジェクションは最新の状態であり、データセットの読み取りに使用されます。