注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。
ネームスペースに対してマッチ条件を作成するための2つの方法があります:
ランディングページからは、マッチ条件サイドバーにリストされている利用可能なマッチ条件の上にある追加を選択します。
機密データスキャンを作成する際には、マッチ条件を選択ページで、新しいマッチ条件を作成し、それをスキャンで直ちに使用することもできます。それには新しいマッチ条件を作成をクリックします。
これら2つの開始点は、どちらも同じマッチ条件作成プロセスを開始します。そこから、Regex(正規表現)マッチ条件を作成するか、Overlap(値の重複)マッチ条件を作成するかを選択できます。
Regexマッチ条件を作成する際には、2種類のregexを指定できます:コンテンツregexと行名regex。
Sensitive Data Scannerでは、これら2つのregexを組み合わせて最大限の特定性を得ることができます:
コンテンツregexには、0より大きく100以下の数値を指定できるオプションのコンテンツ閾値フィールドが含まれています。このコンテンツ閾値は、特定のデータセットの特定の行のセルの割合で、コンテンツregexとマッチする必要があるものです。それが満たされた場合、そのデータセットはマッチとして強調表示されます。コンテンツ閾値フィールドはオプションです。値が指定されていない場合、Sensitive Data Scannerは、コンテンツregexのマッチが少なくとも1つある場合に、データセットをマッチとして強調表示します。
FoundryのユーザーのエンロールメントにAIPが有効化されている場合、AIの助けを借りてコンテンツregexを指定することもできます。これはAIでRegexを生成ボタンを使って行います。このボタンを選択すると、検出したい機密データのタイプを説明するように求められ、提案されたregexとマッチする例が表示され、それからアプリケーションで使用するためのregexが生成されます。以下の図はこのプロセスを示しています。
Overlapマッチ条件は、正規表現(regex)にまとめることができない機密データを探す際に有用です。例えば、名前にマッチするコンテンツregexを作成するのは難しい場合がありますが、行名regexを作成するだけで十分な場合もあります。しかし、すでにスキャンしたい機密データの網羅的なリストを持つデータセットがある場合、Overlapマッチ条件が役立つことがあります。
以下のスクリーンショットは、特定の行を選択する方法の一例です。この例では、accounts_with_context
データセットのEL_employee_name
行が、他のデータとマッチさせるOverlap行として設定されています。Overlap行内の任意のセルが別のデータセット内の任意のセルとマッチする場合、その他のデータセットはこのマッチ条件のマッチとして強調表示されます。