|
문제는 일반인이 타인의 차량등록원부를 쉽게 입수할 수 없다는 데 있다. 자신의 차량등록원부는 쉽게 발급받을 수 있지만 타인 소유 차량의 등록원부를 발급받으려면 차량번호 외에 차량 소유자의 이름까지 알고 있어야 발급받을 수 있어 제한적이다.
CCTV 영상이라고 해서 전부 등장인물을 식별할 수 있는 것도 아니다. 하천의 강우량 등을 측정하는 공공CCTV는 근접 촬영을 통해 안면인식이 가능한 CCTV가 아니다. 그런데도 국내 개인정보보호법과 개인정보보호위원회는 ‘CCTV=개인정보=AI 활용 불가’라는 경직된 정책을 유지하고 있다. 따라서 개인정보보호법 규정 제 2조 제 1호 나목 2문을 들어 차량등록번호 자체를 개인정보로 해석하는 것이 아니라 경찰관이나 구청 직원 등 조회 권한이 있는 사람에게만 개인정보로 해석할 수 있게 해야 한다. 아울러 사람이 나오는 모든 CCTV 영상을 개인정보로 간주하는 대신 안면인식 가능 여부를 기준으로 명확한 판별 기준을 마련해야 한다.
의료 AI나 법률 AI도 상황은 비슷하다. 의료 AI를 개발하려면 대학병원과 제휴해야 하는데, 이들 병원은 윤리위원회의 심사를 받은 후에만 비식별화된 영상정보를 연구용으로 제공한다. 법률 AI를 개발하는 경우에는 대법원 홈페이지에서 판례 하나당 1000원을 들여 구입해야 하는데 100만개 판례를 학습하려면 10억원, 1000만개 판례를 학습하려면 100억원이 든다. 스타트업이 접근하기 힘든 수준이다. 그나마도 1억개에 달하는 대법원 판례 중 공개되는 것은 0.1%도 되지 않는다. 저작권이 있는 경우는 그렇다해도 공공 데이터조차 구하기 어렵다.
미국에서는 의료정보의 경우 HIPAA(Health Insurance Portability and Accountability Act)에 규정된 18개의 속성을 삭제하면 비개인정보로 간주하고 AI 학습 데이터 활용을 허용해 의료 AI 산업 발전에 기여하고 있다. 한국의 개인정보보호법상 ‘처리’의 범위에 관한 개정이 필요한 부분이다.