セキュリティ機密データスキャナーマッチ条件の作成

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

マッチ条件の作成

ネームスペースに対してマッチ条件を作成するための2つの方法があります:

  • Sensitive Data Scannerのランディングページから。
  • 機密データスキャンを作成する際に。

ランディングページからは、マッチ条件サイドバーにリストされている利用可能なマッチ条件の上にある追加を選択します。

create-match-condition-landing-page

機密データスキャンを作成する際には、マッチ条件を選択ページで、新しいマッチ条件を作成し、それをスキャンで直ちに使用することもできます。それには新しいマッチ条件を作成をクリックします。

create-match-condition-scan-creation-page

これら2つの開始点は、どちらも同じマッチ条件作成プロセスを開始します。そこから、Regex(正規表現)マッチ条件を作成するか、Overlap(値の重複)マッチ条件を作成するかを選択できます。

create-match-condition-modal-start

Regexマッチ条件の作成

Regexマッチ条件を作成する際には、2種類のregexを指定できます:コンテンツregexと行名regex。

  • コンテンツRegex: Sensitive Data Scannerがデータセットのコンテンツ(データセットの行名ではない)に対してチェックする正規表現(regex)。
  • 行名Regex: Sensitive Data Scannerがデータセットの行名(コンテンツ自体ではない)に対してチェックする正規表現(regex)。

Sensitive Data Scannerでは、これら2つのregexを組み合わせて最大限の特定性を得ることができます:

  • コンテンツregexがマッチするとデータセットを強調表示します。
  • 行名regexがマッチするとデータセットを強調表示します。
  • コンテンツと行名の両方のregexがマッチするとデータセットを強調表示します。
  • コンテンツまたは行名のいずれかのregexがマッチするとデータセットを強調表示します。

Specify the regex you want to use

コンテンツregexには、0より大きく100以下の数値を指定できるオプションのコンテンツ閾値フィールドが含まれています。このコンテンツ閾値は、特定のデータセットの特定の行のセルの割合で、コンテンツregexとマッチする必要があるものです。それが満たされた場合、そのデータセットはマッチとして強調表示されます。コンテンツ閾値フィールドはオプションです。値が指定されていない場合、Sensitive Data Scannerは、コンテンツregexのマッチが少なくとも1つある場合に、データセットをマッチとして強調表示します。

AIPによるRegexの生成

FoundryのユーザーのエンロールメントにAIPが有効化されている場合、AIの助けを借りてコンテンツregexを指定することもできます。これはAIでRegexを生成ボタンを使って行います。このボタンを選択すると、検出したい機密データのタイプを説明するように求められ、提案されたregexとマッチする例が表示され、それからアプリケーションで使用するためのregexが生成されます。以下の図はこのプロセスを示しています。

LLM showing regex match condition

Overlapマッチ条件の作成

Overlapマッチ条件は、正規表現(regex)にまとめることができない機密データを探す際に有用です。例えば、名前にマッチするコンテンツregexを作成するのは難しい場合がありますが、行名regexを作成するだけで十分な場合もあります。しかし、すでにスキャンしたい機密データの網羅的なリストを持つデータセットがある場合、Overlapマッチ条件が役立つことがあります。

以下のスクリーンショットは、特定の行を選択する方法の一例です。この例では、accounts_with_contextデータセットのEL_employee_name行が、他のデータとマッチさせるOverlap行として設定されています。Overlap行内の任意のセルが別のデータセット内の任意のセルとマッチする場合、その他のデータセットはこのマッチ条件のマッチとして強調表示されます。

Overlap dataset and overlap column selection