大規模な監視

大規模な監視は、新しい機能を導入し、Foundry リソースの監視にかかる時間を削減します。

すでに check groups を使用している場合、これはリソースを監視するための追加オプションと考えてください。既存のワークフローや設定済みの check groups を置き換えることはありません。

用語と定義

メトリクス: リソースはメトリクス、またはログを発行します。モニターはこれらのメトリクス上に作成され、特定のリソースのパフォーマンス基準を設定します。
リソース: Foundry で監視できる「もの」、データセット、エージェント、スケジュール、オブジェクト、リンクタイプなどが含まれます。
スコープ: スコープは、しきい値が設定されたリソースのセットの境界です。リソースは異なるスコープタイプで監視できます。
- シングル: モニターはその特定のリソースにのみ適用されます。
- プロジェクト: モニターは、指定されたタイプのリソースすべてに適用されます。1つまたは複数のプロジェクトに渡ることができます。
監視ルール: しきい値または一連のしきい値を、特定のスコープ内のリソースのメトリクスに設定します。次の要素を含みます:
- リソースタイプ
- メトリクスしきい値許容範囲
- 深刻度レベルの割り当て
監視ビュー: 一群のサブスクライバーが関心を持つ監視ルールのコレクション。
サブスクライバー: 監視ビューをサブスクライブしているユーザー。
アラート: 低、中、高の割り当てがあり、サブスクライバーに送信される通知。

リソースの監視を開始

リソースを監視する方法は 2 つあります:

既存のチェックグループを監視ビューにアップグレードする
新しい監視ビューを作成する

既存のチェックグループを監視ビューにアップグレード

既存のチェックグループをアップグレードするには、Data Health アプリケーションでチェックグループを開きます。上部のバナーで Upgrade to Monitoring View を選択します。

新しい監視ビューを作成するか、すべてのチェックを既存の監視ビューに移動できます。

監視ビューはファイルシステムリソースです。新しい監視ビューを作成する場合は、潜在的なサブスクライバーがアクセスできるプロジェクトに保存してください。
チェックグループをアップグレードした後も、チェックは現在のままサポートされ続けます。メールダイジェスト、アラート、サブスクリプション、その他のヘルスチェックに関連するワークフローに変更はありません。
各チェックグループは単一の監視ビューにリンクされ、逆もまた然りです。したがって、1つのチェックグループを単一の既存の監視ビューにアップグレードするか、適切なものが存在しない場合は新しい監視ビューを作成することしかできません。

新しい監視ビューを作成

新しい監視ビューを作成するには、Data Health アプリの右上の Monitoring View タブに移動し、新しい監視ビューを作成します。

監視ルールを作成

監視ルールを作成するには、Manage monitors タブに移動します。まず、監視するリソースタイプを選択します。リソースタイプによっては、単一スコープでそのリソースのみを監視するか、単一または複数のプロジェクトスコープにわたるそのタイプのすべてのリソースを監視するかを選択できます。

リソースを監視するには、そのリソースに対して Viewer 権限が必要です。アラートを受信するには、リソースと監視ビューに対して Viewer 権限が必要です。

モニターの設定

モニターはリソースが発するメトリクスに設定されます。モニターを設定する際には、Foundry のヘルス基準に基づいて特定の構成を提案します。ただし、値を変更したり、特定のメトリクスのみを監視することもできます。また、アラートが失敗した場合の深刻度レベルを決定することもできます。現在、深刻度タイプは低、中、高の 3 種類です。

モニターの編集

リストからモニターを選択し、表示されるサイドパネルで Edit を選択してモニターを編集できます。

アラートをサブスクライブ

アラートをサブスクライブするには、Manage subscriptions タブに移動し、すべてのサブスクライブされたユーザーが一覧表示されます。ユーザーとユーザーグループを追加し、深刻度に基づいてアラートを構成できます。監視ルールがアラートをトリガーすると、そのアラートを含む監視ビューをサブスクライブしているユーザーにメールおよび Foundry 通知を通じて通知されます。アラートを受信するには、リソースと監視ビューに対して Viewer 権限が必要です。

外部システムとの統合

PagerDuty や Slack などの外部システムにアラートを送信するには、組み込みの統合を使用するか、Webhook を使用して任意の REST エンドポイントに送信します。外部システムにアラートを送信するについてさらに学びます。

FAQ

どのリソースを監視できますか？

以下のリソースを監視できます:

リソースタイプ	サポートされているスコープ
Agent	Single, Project
Object type	Single
Link type	Single
Schedule	Single, Project
Streaming datasets	Single, Project
Live deployments	Project
Time series syncs	Single
Geotemporal observations	Single
Automations	Single, Project
Dataset (coming soon)	Project

リファレンスはこちらにあります。

すべてのヘルスチェックが監視ルールとして存在しますか？

すべてのヘルスチェックが監視ルールとして存在するわけではありませんが、最も重要なヘルスチェックには類似の監視ルールがあります。監視ルールとヘルスチェックを組み合わせて使用することをお勧めします。監視ビューとヘルスチェックからのカバレッジをまとめると以下の通りです。

監視ビューでのみ監視できるリソース: Data connection エージェント、Object Storage V2 (OSv2) のオブジェクトとリンク、Streaming datasets、およびモデルのライブデプロイメント
ヘルスチェックとしてのみ存在するデータセットレベルのチェック: コンテンツ、新鮮度、スキーマチェック、データ期待値、OSv1 (phonograph) および foundry-sync チェック
ヘルスチェックの機能を置き換える監視ルール: 連続スケジュール失敗（スケジュールステータスチェックの置き換え）およびスケジュール期間モニター

最も包括的なカバレッジを得るには、現在監視ビューで利用できないヘルスチェックを含むチェックグループに監視ビューをリンクすることをお勧めします。

監視ルールを使用する理由は何ですか？

モニターは単一のリソースではなくスコープ全体をカバーします。これにより、そのスコープに新しいリソースが追加されると、自動的にルールでカバーされます。たとえば、プロジェクト内のすべてのエージェントを監視するように設定された監視ルールは、後でそのプロジェクトに追加されたエージェントも監視します。

新しい監視ビューを作成するのはいつですか？

単一の監視ビューをチェックグループと同じように考えるのが良い方法です。1つの監視ビューは、そのビュー内のモニターに関心を持つユーザーのセットに関連します。特定のユーザーセット [a, b, c] が特定のプロジェクト [x, y, z] に関心がある場合、これらのプロジェクトのすべてのリソースを含む単一の監視ビューを作成します。特定のユーザーセットがエージェントの監視にのみ関心がある場合、すべてのプロジェクト内のすべてのエージェントを監視するための単一の監視ビューを作成します。

監視ビューに必要な権限は何ですか？

監視ビューはファイルシステムリソースであるため、ユーザーは監視ビューが保存されているプロジェクトまたはフォルダーへの権限が必要です。アラートを受信したり、リソースに監視ルールを設定したりするには、監視したいプロジェクトリソースへのアクセスが必要です。必要なすべての権限を持つユーザーがユーザーまたはグループを監視ビューにサブスクライブしても、新しいサブスクライバーがその監視ビューへの明示的なアクセス権を持っていない場合、そのリソースのアラートは受信しません。

←

PREVIOUS推奨されるサポートプロセス

NEXT監視ルールリファレンス

→