注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

監視ルールリファレンス

監視ルールはリソースごとに設定され、以下のリソースに対するルールがあります。

すべての監視ルールには、条件がトリガーされたときにアラートに付与される重大度であるアラート重大度という設定可能なフィールドが含まれます。監視ビューは、特定の重大度以上のアラートのみを送信するように設定できます。

ルールコンポーネント説明例示オプション
アラート重大度監視レポート条件の重大度Low, Medium, High

エージェントルール

エージェントの最後のハートビート時間

エージェントブートストラッパの最後のハートビートが設定された閾値より古い場合にアラートを発します。

ルールコンポーネント説明例示オプション
値が設定値を超える場合エージェントブートストラッパから最後にハートビートを受信してからの経過時間10 分

この監視値を 10 分に設定することを推奨します。

エージェントマネージャーバージョンの古さ

エージェントブートストラッパのバージョンが設定された閾値より古い場合にアラートを発します。

ルールコンポーネント説明例示オプション
値が設定値を超える場合エージェントマネージャーが古いバージョンのままである期間10 分

この監視値を 10 日に設定することを推奨します。

エージェントバージョンの古さ

エージェントのバージョンが設定された閾値より古い場合にアラートを発します。

ルールコンポーネント説明例示オプション
値が設定値を超える場合エージェントが古いバージョンのままである期間10 日

この監視値を 10 日に設定することを推奨します。

高CPU使用率

エージェントのCPU使用率が設定された閾値を超えた場合にアラートを発します。

ルールコンポーネント説明例示オプション
値が設定値を超える場合CPU使用率の割合80

この監視値を 80 (%) に設定することを推奨します。

JVMヒープ使用率が限界に近い

JVMヒープ使用率が設定された閾値を超えた場合にアラートを発します。

ルールコンポーネント説明例示オプション
値が設定値を超える場合使用されたJVMヒープの割合 / 利用可能なJVMヒープの割合70

この監視値を 70 (%) に設定することを推奨します。

ディスク空き容量が少ない

利用可能なディスク空き容量が設定された閾値を下回った場合にアラートを発します。

ルールコンポーネント説明例示オプション
値が設定値を下回る場合利用可能なディスク空き容量10GB

この監視値を 10GB に設定することを推奨します。

最も早く期限切れになるキーストア証明書の有効期限

エージェントのキーストア内の証明書が設定された閾値内で期限切れになる場合にアラートを発します。

ルールコンポーネント説明例示オプション
値が設定値を下回る場合証明書の有効期限までの期間10 日

この監視値を 30 日未満で中程度の重大度、10 日未満で高い重大度に設定することを推奨します。

最も早く期限切れになるトラストストア証明書の有効期限

エージェントのトラストストア内の証明書が設定された閾値内で期限切れになる場合にアラートを発します。

ルールコンポーネント説明例示オプション
値が設定値を下回る場合証明書の有効期限までの期間10 日

この監視値を 30 日未満で中程度の重大度、10 日未満で高い重大度に設定することを推奨します。

キューサイズ

エージェントにキューイングされたジョブの数が設定された閾値を超えた場合にアラートを発します。

ルールコンポーネント説明例示オプション
値が設定値を超える場合エージェントのジョブキュー内のジョブ数70

この監視値を 70 (ジョブ) に設定することを推奨します。

スケジュールルール

連続スケジュール失敗

連続スケジュール失敗の数が設定された閾値に達した場合、またはそれを超えた場合にアラートを発します。

ルールコンポーネント説明例示オプション
値が設定値以上の場合連続スケジュール失敗の閾値1

このモニターのデフォルト動作は、1回の失敗で中程度の重大度、3回の失敗で高い重大度のアラートを発することですが、これらの閾値はスケジュールの頻度と安定性に大きく依存します。

スケジュールの実行時間

スケジュールの実行時間が設定された閾値を超えた場合にアラートを発します。

ルールコンポーネント説明例示オプション
値が設定値以上の場合スケジュールの実行時間2 時間
このモニターは通常、非常に重要なスケジュールに使用され、スケジュールが期待通りに完了するかどうかを迅速に確認するために使用されます。スケジュールの性質が変動するため、このモニターはしばしばスケジュールスコープで使用されます。

オブジェクトおよびリンクルール

アクティブパイプラインでの変更ログジョブの失敗

オブジェクトまたはリンクのアクティブパイプライン"変更ログ"ジョブが失敗した場合にアラートを発します。このルールは設定不可であり、1回の変更ログジョブ失敗で中程度の重大度、3回の変更ログジョブ失敗で高い重大度のアラートを発します。

アクティブパイプラインでの変更のマージジョブの失敗

オブジェクトまたはリンクのアクティブパイプライン"変更のマージ"ジョブが失敗した場合にアラートを発します。

ルールコンポーネント説明例示オプション
値が設定値以上の場合連続マージジョブ失敗の閾値3

このモニターのデフォルト動作は、1回の失敗で低い重大度、3回の失敗で中程度の重大度、7回の失敗で高い重大度のアラートを発することです。

アクティブパイプラインでの同期ジョブの失敗

オブジェクトまたはリンクのアクティブパイプライン"同期"ジョブが失敗した場合にアラートを発します。

ルールコンポーネント説明例示オプション
値が設定値以上の場合連続同期ジョブ失敗の閾値3

このモニターのデフォルト動作は、1回の失敗で低い重大度、3回の失敗で中程度の重大度、7回の失敗で高い重大度のアラートを発することです。

代替パイプラインでの変更ログジョブの失敗

オブジェクトまたはリンクの代替パイプライン"変更ログ"ジョブが失敗した場合にアラートを発します。このルールは設定不可であり、1回の変更ログジョブ失敗で中程度の重大度、3回の変更ログジョブ失敗で高い重大度のアラートを発します。

代替パイプラインでの変更のマージジョブの失敗

オブジェクトまたはリンクの代替パイプライン"変更のマージ"ジョブが失敗した場合にアラートを発します。

ルールコンポーネント説明例示オプション
値が設定値以上の場合連続マージジョブ失敗の閾値3

このモニターのデフォルト動作は、1回の失敗で低い重大度、3回の失敗で中程度の重大度、7回の失敗で高い重大度のアラートを発することです。

代替パイプラインでの同期ジョブの失敗

オブジェクトまたはリンクの代替パイプライン"同期"ジョブが失敗した場合にアラートを発します。

ルールコンポーネント説明例示オプション
値が設定値以上の場合連続同期ジョブ失敗の閾値3

このモニターのデフォルト動作は、1回の失敗で低い重大度、3回の失敗で中程度の重大度、7回の失敗で高い重大度のアラートを発することです。

パイプラインでのスクロールジョブの失敗

オブジェクトまたはリンクのアクティブまたは代替パイプラインの"スクロール"ジョブが失敗した場合にアラートを発します。スクロールジョブは、バックエンドデータソースからオブジェクトデータベースへのデータストリーミングを担当します。

ルールコンポーネント説明例示オプション
値が設定値以上の場合連続スクロールジョブ失敗の閾値3

このモニターのデフォルト動作は、1回の失敗で低い重大度、3回の失敗で中程度の重大度、7回の失敗で高い重大度のアラートを発し、これらの値は設定可能です。

同期伝播遅延

オブジェクトをバックエンドするデータセットのトランザクションの同期時間が設定された閾値を超えた場合にアラートを発します。

ルールコンポーネント説明例示オプション
値が設定値以上の場合トランザクションを同期するのにかかる時間の閾値1 日

無効なストリームレコードが検出されました

入力ストリームのレコードにフォーマット違反が含まれている場合にアラートを発します。スクロールジョブはこれらのレコードを無視します。このルールは設定不可であり、無視された行の数が 1 以上の場合に重大なアラートを発します。

ストリーミングデータセットルール

派生ストリームモニター

最後のチェックポイントの実行時間

最後のチェックポイントが設定された閾値以上の時間を要した場合にアラートを発します。

ルールコンポーネント説明例示オプション
値が設定値を超える場合チェックポイントにかかる時間の閾値10 分

ライブネス: 最後の成功したチェックポイントからの時間

ストリームが設定された閾値以内にチェックポイントを完了していない場合にアラートを発します。デフォルトの閾値設定は 2 分です。このモニターは、実行されていないストリームやチェックポイントに失敗しているストリームも含みます。

ルールコンポーネント説明例示オプション
値が設定値以上の場合最後のチェックポイントからの経過時間の閾値2 分

総遅延

ストリームの遅延(未処理の上流レコードの総数)が設定された閾値を超えた場合にアラートを発します。

ルールコンポーネント説明例示オプション
値が設定値を超える場合未処理の上流レコードの閾値1000

このモニターは、ストリーミングトランスフォームの実行に時間がかかりすぎているか、ストリーミングトランスフォームのインフラストラクチャに問題があることを示しています。

総スループット

ストリームのスループット(チェックポイントごとに処理されたレコード数)が設定された閾値を下回った場合にアラートを発します。

ルールコンポーネント説明例示オプション
値が設定値を下回る場合チェックポイントごとに処理されたレコードの閾値100

このモニターは、ストリーミングトランスフォームの実行に時間がかかりすぎているか、ストリーミングトランスフォームのインフラストラクチャに問題があることを