데이터 가명화란 개인정보를 가명처리함으로써 원래의 상태로 복원하기 위한 추가 정보의 사용 · 결합 없이는 특정 개인을 알아볼 수 없는 정보를 말한다.
개인정보는 살아있는 개인에 관한 정보로서 성명, 주민등록번호 및 영상 등을 통하여 개인을 알아볼 수 있는
정보이거나 해당 정보만으로는 특정 개인을 알아볼 수 없더라도 다른 정보와 쉽게 결합하여 알아볼 수 있는
정보를 말합니다. 정보를 결합하는 경우에 경우 쉽게 결합할 수 있는지 여부는 다른 정보의 입수 가능성 등
개인을 알아보는 데 소요되는 시간, 비용, 기술 등을 합리적으로 고려하여 판단하여야 합니다.
또한, 개인정보에 대한 판단기준은 개인정보처리자가 보유한 정보 또는 접근 가능한 권한 등 상황에 따라 달라질
수 있습니다.
가명정보는 개인정보의 일부를 삭제하거나 일부 또는 전부를 대체하는 등의 방법으로 추가정보가 없이는 특정 개인을 알아볼 수 없도록 처리된 정보를 말합니다.
익명정보는 시간, 비용 기술 등을 합리적으로 고려할 때 다른 정보를 사용하여도 더 이상 개인을 알아볼 수 없는 정보를 말합니다.
가명정보는 개인정보의 일부를 삭제하거나 일부 또는 전부를 대체하는 등의 방법으로 추가정보 없이는 특정 개인을 알아볼 수 없도록 처리하여 만들 수 있습니다. 이러한 작업을 가명처리하고 하며, 가명처리 시에는 가명정보 자체만으로 특정 개인을 알아볼 수 있는 지 고려해야 하며 또한 추가정보 또는 다른 정보의 결합가능성을 고려하여야 합니다.
* 만약 가명정보처리자가 보유한 다른 정보 등을 통해 개인이 식별 가능한 경우라면 가명처리가 잘못된 경우라고 할 수 있습니다.
분류 | 기술 | 설명 |
---|---|---|
개인정보 삭제 | 삭제기술 | 원본정보에서 개인정보 전체 혹은 일부분을 삭제하여 개인을 식별하지 못하도록 하는 방법 |
개인정보 삭제 | 통계도구 | 평균값, 최댓값, 최솟값, 최빈값, 중간값 열 혹은 행 항목에 해당하는 값을 총계처리하여 개인의 정보를 확인할 수 없도록 하는 방법 |
일반화 기술 | 올림, 내림, 반올림 등의 기준을 적용하여 집계 처리하는 방법으로, 일반적으로 세세한 정보보다는 전체 통계정보가 필요한 경우 많이 사용함 | |
암호화 | 양방향 암호화, 일방향 암호화 등 다양한 암호화 기법을 통해 데이터를 가명화 함 | |
무작위화 기술 | 잡음추가, 순열변경, 토큰화 등의 기법을이용하여 개인정보의 식별위험을 제거하는 방법 | |
기타 기술 | 표본추출 | 데이터 주체별로 전체 모집단이 아닌 표본에 대해 무작위 레코드 추출 등의 기법을 통해 모집단의 일부를 분석하여 전체에 대한 분석을 대신하는 기법 |
해부화 | 기존 하나의 데이터셋(테이블)을 식별성이 있는 정보집합물과 식별성이 없는 정보집합물로 구성된 2개의 데이터셋으로 분리하는 기술 | |
재현데이터 | 원본과 최대한 유사한 통계적 성질을 보이는 가상의 데이터를 생성하기 위해 개인정보의 특성을 분석하여 새로운 데이터를 생성하는 기법 | |
차분 프라이버시 | 특정 개인에 대한 사전지식이 있는 상태에서 데이터베이스 질의(Query)에 대한
응답 값으로 개인을 알 수 없도록 응답 값에 임의의 숫자 잡음(Noise)을 추가하여
특정 개인의 존재 여부를 알 수 없도록 하는 기법 • 1개 항목이 차이나는 두 데이터베이스간의 차이(확률분포)를 기준으로 하는
프라이버시 보호 모델
|