注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。
以下の情報は、データセットのプロジェクションを有効にし、設定し、構築するプロセスをガイドします。
Noho はデータセットのプロジェクションを管理するサービスです。
プロジェクションは、データセットのスキーマに noho: true
を設定することで有効になります。
変換からデータセットを書き込む際や、Details タブでスキーマを手動で修正することで、データセットのスキーマを設定できます。
Copied!1 2 3 4 5 6 7 8 9 10 11 12 13 14
from transforms.api import transform, Input, Output @transform( # 出力データセットのパスを指定します output_dataset=Output('/examples/example_output'), # 入力データセットのパスを指定します input_dataset=Input('/examples/example_input'), ) def compute(output_dataset, input_dataset): # 入力データセットをデータフレームに変換します input_dataset = input_dataset.dataframe() # 変換したデータフレームを出力データセットに書き込みます。オプションで"noho"を"true"に設定します output_dataset.write_dataframe(input_dataset, options={"noho": "true"})
データセットを表示しているときに、スキーマで noho: true
が設定されていて、データセットの編集権限がある場合、プロジェクションタブが表示されます。
新しいプロジェクションを追加
を選択します。
プロジェクションに含める行を選択します。
ほとんどの場合、すべての行
が適しています。しかし、クエリが行のサブセットのみを選択することがわかっている場合、この設定を調整することができます。
プロジェクションのタイプを選択します。
プロジェクションを作成
ボタンを選択します。
プロジェクションは現在存在しますが、データは含まれていません。これは、プロジェクションの隣にある赤い警告アイコンで表示されます。プロジェクションをクエリで使用するには、次のステップに従って最初に構築する必要があります。
リソース使用量をより細かく制御するために、プロジェクションを維持する内部ビルドは自動的にスケジュールされません。明示的に設定する必要があります。
まず、スイッチ 現在のブランチでのプロジェクションビルドを有効化
を切り替えます。これにより、現在のブランチでビルドを実行することができます。
次に、ビルドのスケジュールを設定します。別のブランチでビルドをスケジュールしたい場合、そのブランチに移動してプロセスを繰り返す必要があります。
ビルドを待つことができない場合、ビルドボタンを選択してプロジェクションを明示的にビルドします。
ビルドが完了するのを待ちます。プロジェクションが最新の状態になる前に、複数のビルドが実行されるかもしれません。プロジェクションビルドステータス
の行の隣にある緑のチェックマークは、プロジェクションが完全に最新の状態であることを示します。
プロジェクションは最新の状態であり、データセットの読み取りに使用されます。