Sensitive Data Scanner는 내장 매치 조건 세트를 제공하며, 사용자 정의 맞춤 매치 조건을 정의하여 Sensitive Data Scanner와 함께 사용할 수 있습니다.
Sensitive Data Scanner는 사회 보장 번호, 이메일 주소, 전화번호와 같은 일반적인 PII 유형을 감지하기 위한 다양한 내장 매치 조건을 제공합니다. 오른쪽 사이드바에서 내장 매치 조건 섹션을 확장하기 위해 화살표를 선택하여 이를 찾을 수 있습니다:
내장 매치 조건은 일반적인 개인 데이터를 감지하도록 설계되었습니다. 그러나 특정 데이터 구조 및 형식에 따라 그 효과는 다를 수 있습니다. 이러한 조건이 고유한 데이터 표준과 일치하는지 확인하고, 필요에 따라 맞춤 조건을 생성하십시오. 추가 질문이 있는 경우 데이터 보호 책임자에게 문의하십시오.
공간을 위한 맞춤 매치 조건을 생성하려면 두 가지 방법이 있습니다:
시작 페이지에서, 매치 조건 사이드바에 나열된 맞춤 매치 조건 위의 추가를 선택합니다.
민감한 데이터 스캔을 생성하는 동안, 매치 조건 선택하기 페이지에서 새 매치 조건 생성하기를 선택하여 새로운 매치 조건을 생성하고 즉시 스캔에 사용할 수 있습니다.
이 두 시작점 모두 동일한 매치 조건 생성 프로세스를 엽니다. 여기서 정규 표현식 (regex) 매치 조건 또는 중복 (값 중복) 매치 조건을 생성할지 선택할 수 있습니다.
정규 표현식 (regex) 매치 조건을 생성할 때 지정할 수 있는 두 가지 유형의 regex 옵션이 있습니다; 콘텐츠 regex와 열 이름 regex.
Sensitive Data Scanner는 최대한의 구체성을 위해 이 두 가지 regex 옵션을 결합할 수 있습니다:
콘텐츠 regex에는 0보다 크고 100 이하인 숫자를 지정할 수 있는 선택적 콘텐츠 임계값 필드가 포함되어 있습니다; 이 콘텐츠 임계값은 주어진 데이터셋의 특정 열의 셀 중 콘텐츠 regex와 일치해야 하는 비율입니다. 콘텐츠 임계값 필드는 선택 사항입니다. 값이 지정되지 않으면, 콘텐츠 regex의 일치 항목이 하나 이상 있는 경우 Sensitive Data Scanner는 데이터셋을 일치 항목으로 강조합니다.
Foundry에서 AIP가 활성화된 경우, AI의 도움으로 콘텐츠 regex를 지정할 수 있는 기능도 있습니다. AI로 Regex 생성하기 버튼을 사용하여 이를 수행할 수 있습니다. 이 버튼을 선택하면 감지할 민감한 데이터 유형을 설명하도록 요청받고, 예를 들어 "모든 이메일 주소"와 같은 예시를 보여주며, 애플리케이션에서 사용할 regex를 생성합니다. 아래 그래픽은 이 과정을 보여줍니다.
중복 매치 조건은 regex로 추출할 수 없는 민감한 데이터를 찾을 때 유용합니다. 예를 들어, 이름과 일치하는 콘텐츠 regex를 생성하는 것은 어려울 수 있지만, 경우에 따라 열 이름 regex를 생성하는 것으로 충분할 수 있습니다. 그러나 이미 스캔하려는 민감한 데이터의 포괄적인 목록이 포함된 데이터셋이 있는 경우 중복 매치 조건이 유용할 수 있습니다.
아래 스크린샷은 특정 열을 선택하는 방법의 예입니다. 이 예에서는 accounts_with_context
데이터셋의 EL_employee_name
열이 다른 데이터와 일치시킬 중복 열로 설정되었습니다. 중복 열의 셀이 다른 데이터셋의 셀과 일치하면, 그 다른 데이터셋은 이 매치 조건의 일치 항목으로 강조됩니다.