Resources

Fasoo의 제품 및 기술 관련 정보를 공유 드립니다.

개인정보 OCR 마스킹, PDF 파일부터 이미지 속 개인정보까지

해마다 반복되는 개인정보 유출 사고 소식에 익숙해질 만도 하지만, 올해 공개된 통계는 여전히 간과할 수 없는 현실을 보여줍니다. 개인정보보호위원회 (이하 개인정보위)가 발표한 ‘2024년 개인정보 유출 신고 동향 분석’에 따르면, 지난해 접수된 유출 신고는 총 307건이었고, 이 중 해킹이 절반 이상을 차지했습니다. 하지만 눈에 띄는 건 외부 공격만이 아니었습니다. 이메일 첨부, 게시판 업로드, 업무용 기기 분실처럼 업무상 실수로 인한 유출도 빈번하게 발생하고 있었습니다.

이러한 정보 유출 사고의 가장 큰 문제는 단순히 ‘사고가 일어났다’는 사실보다, 어디에 어떤 개인정보가 있는지조차 모르는 상태로 유출이 반복되고 있다는 점입니다. 기업 및 기관은 수많은 문서, 이미지, 스캔본 등을 파일 서버, 클라우드, 로컬 PC 등 다양한 저장소에 보관하고 있지만, 그 안에 어떤 민감정보가 포함돼 있는지 체계적으로 파악하기란 쉽지 않습니다. 유출을 막기 위한 첫걸음이 ‘개인정보를 식별하는 것’이라면, 지금은 그 출발선에도 서지 못한 조직이 많다는 뜻이죠.

2024 개인정보 유출 사고 현황 / 출처 : 개인정보위

그렇다면 이런 개인정보유출 사고를 막기 위해, 조직은 어디서부터 점검해야 할까요?

앞서 말했듯 문제의 출발점은 ‘무엇이 어디에 있는지 모른다’는 불투명한 데이터 관리 환경에서 시작합니다. 시간이 흐르며 축적된 수많은 문서, 이미지, 스캔본 등이 여러 저장소에 흩어져 있고, 그 안에 어떤 민감정보가 포함돼 있는지 파악조차 되지 않는 경우가 대부분이죠.

특히 이러한 정보들은 대개 비정형 데이터 형태로 존재합니다. 데이터마다 구조와 형식이 제각각이고, 이름이나 주민번호처럼 민감 정보가 포함된 경우도 있어 이를 직접 확인하고 관리하는 것은 쉽지 않습니다. 결국 개인정보가 담긴 파일이 어떤 상태로, 어디에 존재하는지 알 수 없다면 보안도, 보호도 시작될 수 없습니다. 이런 환경에서 필요한 건, 보유한 비정형데이터를 식별하고, 그 위치와 내용을 명확히 들여다볼 수 있는 관점과 수단입니다.

보유한 데이터의 ‘정확한’ 식별은 안전한 관리의 출발점

Fasoo Data Radar (이하 FDR)는 조직이 보유한 로컬 PC, 파일 서버, 클라우드 저장소 등 다양한 환경에서 비정형 데이터를 식별하고, 어디에 어떤 개인정보가 있는지 한눈에 파악할 수 있도록 지원하는 개인정보 검출 관리 솔루션입니다. 복잡하게 흩어진 데이터 구조 속에서 민감 정보를 찾아내고, 그 위치와 보유 현황을 모니터링할 수 있는 기반을 마련해 주죠.

또한 FDR은 단순 탐지를 넘어, 데이터 중요도에 따라 다양한 보안 정책을 적용할 수 있습니다. 예를 들어, 개인정보가 포함된 파일은 암호화하거나 별도로 격리하고, 사용 권한을 제한하거나 삭제 처리하는 등 다양한 후처리를 설정해 적절한 보안을 적용할 수 있는 거죠. 뿐만 아니라 GDPR, HIPAA, PCI 등 주요 규제에도 대응 가능한 정책 템플릿과 오탐을 줄여주는 구조를 통해, 조직이 컴플라이언스를 효과적으로 준수할 수 있도록 설계돼 있습니다.

Fasoo Data Radar 바로가기

분산된 데이터를 식별하고 가시성을 제공하는 FDR

최근에는 많은 조직이 개인정보 보호 솔루션을 갖추고 있기도 합니다. 즉, 이제는 솔루션을 도입하는 것이 아니라 교체가 필요한 시점도 고려해야 하는 거죠. 특히 도입 후 시간이 지난 제품의 경우, PDF나 이미지와 같은 비정형 데이터 속 개인정보까지 제대로 보호하고 있는지 점검할 필요가 있습니다. 파일 하나를 공유했을 뿐인데 스캔된 개인정보가 그대로 노출되는 사고가 발생하는 이유도 이런 지점에서 시작되기 때문이죠. 이제 솔루션을 교체한다면, 탐지를 넘어 OCR (광학 문자 인식) 기반 개인정보 식별 및 마스킹까지 가능한지가 하나의 중요한 기준이 되고 있습니다. 실제 업무 환경에서 유출 가능성이 높은 포맷에 대응할 수 있는지와 같은 현실적인 시선으로 교체를 검토해볼 필요가 있습니다.

이런 고객들의 요구를 반영해 개발된 솔루션이 바로 Fasoo AI-R Privacy입니다.

AI-R Privacy는 트랜스포머 기반의 자연어 처리 언어 모델을 바탕으로, 비정형데이터 속 개인정보를 정확하게 탐지하고 보호하는 AI 기반 개인정보보호 솔루션입니다. 특히, OCR 기술을 통해 이미지 내부의 텍스트 정보까지 식별 및 마스킹할 수 있는데요. 딥러닝 기반 분석과 정규식 방식을 교차 지원해 복잡한 문맥 속 민감정보도 효과적으로 찾아내며, 검출된 파일의 유형, 처리 결과 등 세부 로그를 관리자가 직접 확인하고 조치할 수 있습니다.

외부 공유 문서, 스캔본, 진료기록 이미지 등 산업별로 다양한 형태로 존재하는 비정형 데이터에도 폭넓게 적용할 수 있어, 실무 환경에서의 실질적인 개인정보 보호 수단으로 활용될 수 있습니다.

Fasoo AI-R Privacy 바로가기

개인정보가 점점 늘어나는만큼 대응할 수 있는 솔루션은 필수

​이제 개인정보 보호는 단순히 저장소를 지키는 일에서 한 걸음 더 나아가야 합니다. 조직 내부에 어떤 데이터가 있는지 파악하고, 민감정보를 체계적으로 관리하면서 실제 업무 현장에서 발생할 수 있는 개인정보 유출까지 폭넓게 대응할 수 있어야 하죠.

이제는 보유한 개인정보를 제대로 들여다보고, 관리하고, 실질적으로 보호할 수 있는 방식을 고민할 때입니다.

개인정보 보호 솔루션의 도입 혹은 교체를 원하신다면 언제든 파수에게 연락해 주세요!

Inquiry

개인정보 보호 전문가

만나러 가기

FDI Go

찾아가는 세미나

자세히 알아보기

추가 문의사항을 남겨주세요.