注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。
監視ルールはリソースごとに設定され、以下のリソースに対するルールがあります。
すべての監視ルールには、条件がトリガーされたときにアラートに付与される重大度であるアラート重大度という設定可能なフィールドが含まれます。監視ビューは、特定の重大度以上のアラートのみを送信するように設定できます。
ルールコンポーネント | 説明 | 例示オプション |
---|---|---|
アラート重大度 | 監視レポート条件の重大度 | Low, Medium, High |
エージェントブートストラッパの最後のハートビートが設定された閾値より古い場合にアラートを発します。
ルールコンポーネント | 説明 | 例示オプション |
---|---|---|
値が設定値を超える場合 | エージェントブートストラッパから最後にハートビートを受信してからの経過時間 | 10 分 |
この監視値を 10 分に設定することを推奨します。
エージェントブートストラッパのバージョンが設定された閾値より古い場合にアラートを発します。
ルールコンポーネント | 説明 | 例示オプション |
---|---|---|
値が設定値を超える場合 | エージェントマネージャーが古いバージョンのままである期間 | 10 分 |
この監視値を 10 日に設定することを推奨します。
エージェントのバージョンが設定された閾値より古い場合にアラートを発します。
ルールコンポーネント | 説明 | 例示オプション |
---|---|---|
値が設定値を超える場合 | エージェントが古いバージョンのままである期間 | 10 日 |
この監視値を 10 日に設定することを推奨します。
エージェントのCPU使用率が設定された閾値を超えた場合にアラートを発します。
ルールコンポーネント | 説明 | 例示オプション |
---|---|---|
値が設定値を超える場合 | CPU使用率の割合 | 80 |
この監視値を 80 (%) に設定することを推奨します。
JVMヒープ使用率が設定された閾値を超えた場合にアラートを発します。
ルールコンポーネント | 説明 | 例示オプション |
---|---|---|
値が設定値を超える場合 | 使用されたJVMヒープの割合 / 利用可能なJVMヒープの割合 | 70 |
この監視値を 70 (%) に設定することを推奨します。
利用可能なディスク空き容量が設定された閾値を下回った場合にアラートを発します。
ルールコンポーネント | 説明 | 例示オプション |
---|---|---|
値が設定値を下回る場合 | 利用可能なディスク空き容量 | 10GB |
この監視値を 10GB に設定することを推奨します。
エージェントのキーストア内の証明書が設定された閾値内で期限切れになる場合にアラートを発します。
ルールコンポーネント | 説明 | 例示オプション |
---|---|---|
値が設定値を下回る場合 | 証明書の有効期限までの期間 | 10 日 |
この監視値を 30 日未満で中程度の重大度、10 日未満で高い重大度に設定することを推奨します。
エージェントのトラストストア内の証明書が設定された閾値内で期限切れになる場合にアラートを発します。
ルールコンポーネント | 説明 | 例示オプション |
---|---|---|
値が設定値を下回る場合 | 証明書の有効期限までの期間 | 10 日 |
この監視値を 30 日未満で中程度の重大度、10 日未満で高い重大度に設定することを推奨します。
エージェントにキューイングされたジョブの数が設定された閾値を超えた場合にアラートを発します。
ルールコンポーネント | 説明 | 例示オプション |
---|---|---|
値が設定値を超える場合 | エージェントのジョブキュー内のジョブ数 | 70 |
この監視値を 70 (ジョブ) に設定することを推奨します。
連続スケジュール失敗の数が設定された閾値に達した場合、またはそれを超えた場合にアラートを発します。
ルールコンポーネント | 説明 | 例示オプション |
---|---|---|
値が設定値以上の場合 | 連続スケジュール失敗の閾値 | 1 |
このモニターのデフォルト動作は、1回の失敗で中程度の重大度、3回の失敗で高い重大度のアラートを発することですが、これらの閾値はスケジュールの頻度と安定性に大きく依存します。
スケジュールの実行時間が設定された閾値を超えた場合にアラートを発します。
ルールコンポーネント | 説明 | 例示オプション |
---|---|---|
値が設定値以上の場合 | スケジュールの実行時間 | 2 時間 |
このモニターは通常、非常に重要なスケジュールに使用され、スケジュールが期待通りに完了するかどうかを迅速に確認するために使用されます。スケジュールの性質が変動するため、このモニターはしばしばスケジュールスコープで使用されます。 |
オブジェクトまたはリンクのアクティブパイプラインの"変更ログ"ジョブが失敗した場合にアラートを発します。このルールは設定不可であり、1回の変更ログジョブ失敗で中程度の重大度、3回の変更ログジョブ失敗で高い重大度のアラートを発します。
オブジェクトまたはリンクのアクティブパイプラインの"変更のマージ"ジョブが失敗した場合にアラートを発します。
ルールコンポーネント | 説明 | 例示オプション |
---|---|---|
値が設定値以上の場合 | 連続マージジョブ失敗の閾値 | 3 |
このモニターのデフォルト動作は、1回の失敗で低い重大度、3回の失敗で中程度の重大度、7回の失敗で高い重大度のアラートを発することです。
オブジェクトまたはリンクのアクティブパイプラインの"同期"ジョブが失敗した場合にアラートを発します。
ルールコンポーネント | 説明 | 例示オプション |
---|---|---|
値が設定値以上の場合 | 連続同期ジョブ失敗の閾値 | 3 |
このモニターのデフォルト動作は、1回の失敗で低い重大度、3回の失敗で中程度の重大度、7回の失敗で高い重大度のアラートを発することです。
オブジェクトまたはリンクの代替パイプラインの"変更ログ"ジョブが失敗した場合にアラートを発します。このルールは設定不可であり、1回の変更ログジョブ失敗で中程度の重大度、3回の変更ログジョブ失敗で高い重大度のアラートを発します。
オブジェクトまたはリンクの代替パイプラインの"変更のマージ"ジョブが失敗した場合にアラートを発します。
ルールコンポーネント | 説明 | 例示オプション |
---|---|---|
値が設定値以上の場合 | 連続マージジョブ失敗の閾値 | 3 |
このモニターのデフォルト動作は、1回の失敗で低い重大度、3回の失敗で中程度の重大度、7回の失敗で高い重大度のアラートを発することです。
オブジェクトまたはリンクの代替パイプラインの"同期"ジョブが失敗した場合にアラートを発します。
ルールコンポーネント | 説明 | 例示オプション |
---|---|---|
値が設定値以上の場合 | 連続同期ジョブ失敗の閾値 | 3 |
このモニターのデフォルト動作は、1回の失敗で低い重大度、3回の失敗で中程度の重大度、7回の失敗で高い重大度のアラートを発することです。
オブジェクトまたはリンクのアクティブまたは代替パイプラインの"スクロール"ジョブが失敗した場合にアラートを発します。スクロールジョブは、バックエンドデータソースからオブジェクトデータベースへのデータストリーミングを担当します。
ルールコンポーネント | 説明 | 例示オプション |
---|---|---|
値が設定値以上の場合 | 連続スクロールジョブ失敗の閾値 | 3 |
このモニターのデフォルト動作は、1回の失敗で低い重大度、3回の失敗で中程度の重大度、7回の失敗で高い重大度のアラートを発し、これらの値は設定可能です。
オブジェクトをバックエンドするデータセットのトランザクションの同期時間が設定された閾値を超えた場合にアラートを発します。
ルールコンポーネント | 説明 | 例示オプション |
---|---|---|
値が設定値以上の場合 | トランザクションを同期するのにかかる時間の閾値 | 1 日 |
入力ストリームのレコードにフォーマット違反が含まれている場合にアラートを発します。スクロールジョブはこれらのレコードを無視します。このルールは設定不可であり、無視された行の数が 1 以上の場合に重大なアラートを発します。
最後のチェックポイントが設定された閾値以上の時間を要した場合にアラートを発します。
ルールコンポーネント | 説明 | 例示オプション |
---|---|---|
値が設定値を超える場合 | チェックポイントにかかる時間の閾値 | 10 分 |
ストリームが設定された閾値以内にチェックポイントを完了していない場合にアラートを発します。デフォルトの閾値設定は 2 分です。このモニターは、実行されていないストリームやチェックポイントに失敗しているストリームも含みます。
ルールコンポーネント | 説明 | 例示オプション |
---|---|---|
値が設定値以上の場合 | 最後のチェックポイントからの経過時間の閾値 | 2 分 |
ストリームの遅延(未処理の上流レコードの総数)が設定された閾値を超えた場合にアラートを発します。
ルールコンポーネント | 説明 | 例示オプション |
---|---|---|
値が設定値を超える場合 | 未処理の上流レコードの閾値 | 1000 |
このモニターは、ストリーミングトランスフォームの実行に時間がかかりすぎているか、ストリーミングトランスフォームのインフラストラクチャに問題があることを示しています。
ストリームのスループット(チェックポイントごとに処理されたレコード数)が設定された閾値を下回った場合にアラートを発します。
ルールコンポーネント | 説明 | 例示オプション |
---|---|---|
値が設定値を下回る場合 | チェックポイントごとに処理されたレコードの閾値 | 100 |
このモニターは、ストリーミングトランスフォームの実行に時間がかかりすぎているか、ストリーミングトランスフォームのインフラストラクチャに問題があることを