注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。
Foundry を Google Pub/Sub に接続して、リアルタイムでトピックからデータを Foundry ストリームに読み込みます。
機能 | 状況 |
---|---|
ストリーミング同期 | 🟢 一般に利用可能 |
データ接続エクスポート | 🟢 一般に利用可能 |
コネクタはメッセージの内容を解析せず、任意のタイプのデータを Foundry に同期できます。すべてのコンテンツは、未解析のまま data
行にアップロードされます。下流のストリーミング変換(例えば、Pipeline Builder の parse_json
)を使用してデータを解析します。id
行には、Pub/Sub から受信したメッセージ ID が表示されます。
id (文字列) | data (文字列) |
---|---|
5986331692832221 | {"firstName": "John", "lastName": "Doe"} |
5986326266478130 | test-payload |
同期を設定する際、Foundry のデータセットのスキーマは上記のスキーマと一致する必要があります。
コネクタはシングルコンシューマスレッドを使用して Pub/Sub からメッセージを同期します。Foundry から Pub/Sub へのデータエクスポート時には、Foundry データストリームのパーティションごとに 1 つのスレッドが使用されます。
ストリーミング同期は、Foundry の出力データセットに基づいてサブスクリプションを作成します。資格情報にはサブスクリプションを作成するための権限が必要です。同じトピックから読み取るように設定された複数のインポートがある場合、それぞれが自分のサブスクリプションを作成し、トピック上のすべてのメッセージを読み取ります。
ストリーミング同期は一貫性のある、長期にわたるジョブを目指しています。ストリーミング同期が中断されると、期待される結果によってはアウトエージが発生する可能性があります。
Foundry でストリーミング同期を設定する前に、以下の点を考慮してください。
Foundry での コネクタの設定 について詳しくはこちらをご覧ください。
2 つの利用可能な認証方法から選択してください:
GCP インスタンスアカウント: Google Cloud ドキュメンテーション(外部)を参照して、インスタンスベースの認証の設定方法を学びます。
サービスアカウントキーファイル: Google Cloud ドキュメンテーション(外部)を参照して、サービスアカウントキーファイル認証の設定方法を学びます。キーファイルは JSON または PKCS8 の資格情報として提供できます。
設定された資格情報は以下にアクセスできる必要があります:
roles/pubsub.viewer
roles/pubsub.subscriber
projects.subscriptions.create
roles/pubsub.publisher
以下の設定オプションは、Pub/Sub コネクタに利用可能です:
Option | Required? | Description |
---|---|---|
Project ID | Yes | GCP のプロジェクト ID。 |
Credentials settings | Yes | 上記の 認証 ガイダンスを使用して設定します。 |
Proxy settings | No | Pub/Sub へのプロキシ接続を許可する。 |
GRPC Settings | No* | GRPC チャンネルを設定するための高度な設定。 |
ストリーミング同期の設定 チュートリアルで、Pub/Sub との同期の設定方法を学びます。
同期を設定する際、データセットのスキーマは、上記の (データモデルセクション)[#data-model] で説明されているスキーマと一致する必要があります。
コネクタは、データ接続を介して Pub/Sub へのストリームのエクスポートをサポートしています。
Pub/Sub へのエクスポートを行うには、まず Pub/Sub コネクタで エクスポートを有効にします。次に、新しいエクスポートを作成します。
Option | Required? | Default | Description |
---|---|---|---|
Topic | Yes | N/A | エクスポートしたい Pub/Sub トピック。 |
Value Column | No | N/A | ここに値が指定されていない場合、Foundry ストリームのレコードの内容全体が文字列として Pub/Sub に書き込まれます。指定された場合、Value Column の内容のみが Pub/Sub にエクスポートされます。 |