注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

大規模な監視

大規模な監視は、新しい機能を導入し、Foundry リソースの監視にかかる時間を削減します。

すでに check groups を使用している場合、これはリソースを監視するための追加オプションと考えてください。既存のワークフローや設定済みの check groups を置き換えることはありません。

用語と定義

  • メトリクス: リソースはメトリクス、またはログを発行します。モニターはこれらのメトリクス上に作成され、特定のリソースのパフォーマンス基準を設定します。
  • リソース: Foundry で監視できる「もの」、データセット、エージェント、スケジュール、オブジェクト、リンクタイプなどが含まれます。
  • スコープ: スコープは、しきい値が設定されたリソースのセットの境界です。リソースは異なるスコープタイプで監視できます。
    • シングル: モニターはその特定のリソースにのみ適用されます。
    • プロジェクト: モニターは、指定されたタイプのリソースすべてに適用されます。1つまたは複数のプロジェクトに渡ることができます。
  • 監視ルール: しきい値または一連のしきい値を、特定のスコープ内のリソースのメトリクスに設定します。次の要素を含みます:
    • リソースタイプ
    • メトリクスしきい値許容範囲
    • 深刻度レベルの割り当て
  • 監視ビュー: 一群のサブスクライバーが関心を持つ監視ルールのコレクション。
  • サブスクライバー: 監視ビューをサブスクライブしているユーザー。
  • アラート: 低、中、高の割り当てがあり、サブスクライバーに送信される通知。

リソースの監視を開始

リソースを監視する方法は 2 つあります:

  • 既存のチェックグループを監視ビューにアップグレードする
  • 新しい監視ビューを作成する

既存のチェックグループを監視ビューにアップグレード

既存のチェックグループをアップグレードするには、Data Health アプリケーションでチェックグループを開きます。上部のバナーで Upgrade to Monitoring View を選択します。

新しい監視ビューを作成するか、すべてのチェックを既存の監視ビューに移動できます。

  • 監視ビューはファイルシステムリソースです。新しい監視ビューを作成する場合は、潜在的なサブスクライバーがアクセスできるプロジェクトに保存してください。
  • チェックグループをアップグレードした後も、チェックは現在のままサポートされ続けます。メールダイジェスト、アラート、サブスクリプション、その他のヘルスチェックに関連するワークフローに変更はありません。
  • 各チェックグループは単一の監視ビューにリンクされ、逆もまた然りです。したがって、1つのチェックグループを単一の既存の監視ビューにアップグレードするか、適切なものが存在しない場合は新しい監視ビューを作成することしかできません。

新しい監視ビューを作成

新しい監視ビューを作成するには、Data Health アプリの右上の Monitoring View タブに移動し、新しい監視ビューを作成します。

監視ルールを作成

監視ルールを作成するには、Manage monitors タブに移動します。まず、監視するリソースタイプを選択します。リソースタイプによっては、単一スコープでそのリソースのみを監視するか、単一または複数のプロジェクトスコープにわたるそのタイプのすべてのリソースを監視するかを選択できます。

リソースを監視するには、そのリソースに対して Viewer 権限が必要です。アラートを受信する には、リソースと監視ビューに対して Viewer 権限が必要です。

モニターの設定

モニターはリソースが発するメトリクスに設定されます。モニターを設定する際には、Foundry のヘルス基準に基づいて特定の構成を提案します。ただし、値を変更したり、特定のメトリクスのみを監視することもできます。また、アラートが失敗した場合の深刻度レベルを決定することもできます。現在、深刻度タイプは低、中、高の 3 種類です。

モニターの編集

リストからモニターを選択し、表示されるサイドパネルで Edit を選択してモニターを編集できます。

アラートをサブスクライブ

アラートをサブスクライブするには、Manage subscriptions タブに移動し、すべてのサブスクライブされたユーザーが一覧表示されます。ユーザーとユーザーグループを追加し、深刻度に基づいてアラートを構成できます。監視ルールがアラートをトリガーすると、そのアラートを含む監視ビューをサブスクライブしているユーザーにメールおよび Foundry 通知を通じて通知されます。アラートを受信するには、リソースと監視ビューに対して Viewer 権限が必要です。

外部システムとの統合

PagerDuty や Slack などの外部システムにアラートを送信するには、組み込みの統合を使用するか、Webhook を使用して任意の REST エンドポイントに送信します。外部システムにアラートを送信する についてさらに学びます。

FAQ

どのリソースを監視できますか?

以下のリソースを監視できます:

リソースタイプサポートされているスコープ
AgentSingle, Project
Object typeSingle
Link typeSingle
ScheduleSingle, Project
Streaming datasetsSingle, Project
Live deploymentsProject
Time series syncsSingle
Geotemporal observationsSingle
AutomationsSingle, Project
Dataset (coming soon)Project

リファレンスは こちら にあります。

すべてのヘルスチェックが監視ルールとして存在しますか?

すべてのヘルスチェックが監視ルールとして存在するわけではありませんが、最も重要なヘルスチェックには類似の監視ルールがあります。監視ルールとヘルスチェックを組み合わせて使用することをお勧めします。監視ビューとヘルスチェックからのカバレッジをまとめると以下の通りです。

  1. 監視ビューでのみ監視できるリソース: Data connection エージェント、Object Storage V2 (OSv2) のオブジェクトとリンク、Streaming datasets、およびモデルのライブデプロイメント
  2. ヘルスチェックとしてのみ存在するデータセットレベルのチェック: コンテンツ、新鮮度、スキーマチェック、データ期待値、OSv1 (phonograph) および foundry-sync チェック
  3. ヘルスチェックの機能を置き換える監視ルール: 連続スケジュール失敗(スケジュールステータスチェックの置き換え)およびスケジュール期間モニター

最も包括的なカバレッジを得るには、現在監視ビューで利用できないヘルスチェックを含むチェックグループに監視ビューをリンクすることをお勧めします。

監視ルールを使用する理由は何ですか?

モニターは単一のリソースではなくスコープ全体をカバーします。これにより、そのスコープに新しいリソースが追加されると、自動的にルールでカバーされます。たとえば、プロジェクト内のすべてのエージェントを監視するように設定された監視ルールは、後でそのプロジェクトに追加されたエージェントも監視します。

新しい監視ビューを作成するのはいつですか?

単一の監視ビューをチェックグループと同じように考えるのが良い方法です。1つの監視ビューは、そのビュー内のモニターに関心を持つユーザーのセットに関連します。特定のユーザーセット [a, b, c] が特定のプロジェクト [x, y, z] に関心がある場合、これらのプロジェクトのすべてのリソースを含む単一の監視ビューを作成します。特定のユーザーセットがエージェントの監視にのみ関心がある場合、すべてのプロジェクト内のすべてのエージェントを監視するための単一の監視ビューを作成します。

監視ビューに必要な権限は何ですか?

監視ビューはファイルシステムリソースであるため、ユーザーは監視ビューが保存されているプロジェクトまたはフォルダーへの権限が必要です。アラートを受信したり、リソースに監視ルールを設定したりするには、監視したいプロジェクトリソースへのアクセスが必要です。必要なすべての権限を持つユーザーがユーザーまたはグループを監視ビューにサブスクライブしても、新しいサブスクライバーがその監視ビューへの明示的なアクセス権を持っていない場合、そのリソースのアラートは受信しません。