보안Sensitive Data Scanner매치 조건 생성

본 번역은 검증되지 않았습니다. AIP를 통해 영문원문으로부터 번역되었습니다.

매치 조건 생성

Sensitive Data Scanner는 내장 매치 조건 세트를 제공하며, 사용자 정의 맞춤 매치 조건을 정의하여 Sensitive Data Scanner와 함께 사용할 수 있습니다.

내장 매치 조건

Sensitive Data Scanner는 사회 보장 번호, 이메일 주소, 전화번호와 같은 일반적인 PII 유형을 감지하기 위한 다양한 내장 매치 조건을 제공합니다. 오른쪽 사이드바에서 내장 매치 조건 섹션을 확장하기 위해 화살표를 선택하여 이를 찾을 수 있습니다:

내장 매치 조건 사이드바.

내장 매치 조건은 일반적인 개인 데이터를 감지하도록 설계되었습니다. 그러나 특정 데이터 구조 및 형식에 따라 그 효과는 다를 수 있습니다. 이러한 조건이 고유한 데이터 표준과 일치하는지 확인하고, 필요에 따라 맞춤 조건을 생성하십시오. 추가 질문이 있는 경우 데이터 보호 책임자에게 문의하십시오.

맞춤 매치 조건 생성

공간을 위한 맞춤 매치 조건을 생성하려면 두 가지 방법이 있습니다:

  • Sensitive Data Scanner 시작 페이지에서.
  • 민감한 데이터 스캔을 생성하는 동안.

시작 페이지에서, 매치 조건 사이드바에 나열된 맞춤 매치 조건 위의 추가를 선택합니다.

시작 페이지에서 매치 조건 생성.

민감한 데이터 스캔을 생성하는 동안, 매치 조건 선택하기 페이지에서 새 매치 조건 생성하기를 선택하여 새로운 매치 조건을 생성하고 즉시 스캔에 사용할 수 있습니다.

스캔 생성 페이지에서 매치 조건 생성.

이 두 시작점 모두 동일한 매치 조건 생성 프로세스를 엽니다. 여기서 정규 표현식 (regex) 매치 조건 또는 중복 (값 중복) 매치 조건을 생성할지 선택할 수 있습니다.

매치 조건 생성 모달.

정규 표현식 매치 조건 생성

정규 표현식 (regex) 매치 조건을 생성할 때 지정할 수 있는 두 가지 유형의 regex 옵션이 있습니다; 콘텐츠 regex와 열 이름 regex.

  • 콘텐츠 regex: Sensitive Data Scanner가 데이터셋의 콘텐츠에 대해 확인할 regex (데이터셋의 열 이름이 아님).
  • 열 이름 regex: Sensitive Data Scanner가 데이터셋의 열 이름에 대해 확인할 regex (콘텐츠 자체가 아님).

Sensitive Data Scanner는 최대한의 구체성을 위해 이 두 가지 regex 옵션을 결합할 수 있습니다:

  • 콘텐츠 regex가 일치하면 데이터셋 강조.
  • 열 이름 regex가 일치하면 데이터셋 강조.
  • 콘텐츠와 열 이름 regex가 모두 일치하면 데이터셋 강조.
  • 콘텐츠 또는 열 이름 regex가 둘 중 하나라도 일치하면 데이터셋 강조.

사용할 regex 지정하기.

콘텐츠 regex에는 0보다 크고 100 이하인 숫자를 지정할 수 있는 선택적 콘텐츠 임계값 필드가 포함되어 있습니다; 이 콘텐츠 임계값은 주어진 데이터셋의 특정 열의 셀 중 콘텐츠 regex와 일치해야 하는 비율입니다. 콘텐츠 임계값 필드는 선택 사항입니다. 값이 지정되지 않으면, 콘텐츠 regex의 일치 항목이 하나 이상 있는 경우 Sensitive Data Scanner는 데이터셋을 일치 항목으로 강조합니다.

AIP를 통한 Regex 생성

Foundry에서 AIP가 활성화된 경우, AI의 도움으로 콘텐츠 regex를 지정할 수 있는 기능도 있습니다. AI로 Regex 생성하기 버튼을 사용하여 이를 수행할 수 있습니다. 이 버튼을 선택하면 감지할 민감한 데이터 유형을 설명하도록 요청받고, 예를 들어 "모든 이메일 주소"와 같은 예시를 보여주며, 애플리케이션에서 사용할 regex를 생성합니다. 아래 그래픽은 이 과정을 보여줍니다.

LLM이 regex 매치 조건을 보여줌.

중복 매치 조건 생성

중복 매치 조건은 regex로 추출할 수 없는 민감한 데이터를 찾을 때 유용합니다. 예를 들어, 이름과 일치하는 콘텐츠 regex를 생성하는 것은 어려울 수 있지만, 경우에 따라 열 이름 regex를 생성하는 것으로 충분할 수 있습니다. 그러나 이미 스캔하려는 민감한 데이터의 포괄적인 목록이 포함된 데이터셋이 있는 경우 중복 매치 조건이 유용할 수 있습니다.

아래 스크린샷은 특정 열을 선택하는 방법의 예입니다. 이 예에서는 accounts_with_context 데이터셋의 EL_employee_name 열이 다른 데이터와 일치시킬 중복 열로 설정되었습니다. 중복 열의 셀이 다른 데이터셋의 셀과 일치하면, 그 다른 데이터셋은 이 매치 조건의 일치 항목으로 강조됩니다.

중복 데이터셋 및 중복 열 선택.