"엔비디아가 무단도용했다"…AI저작권 분쟁, 어디까지

[이데일리 박종화 기자] 인공지능(AI) 개발사의 저작권 침해 논란이 지속적으로 확산하고 있다. 이번엔 엔비디아의 생성형 AI 플랫폼 ‘네모’가 소설 저작권을 침해했다는 혐의로 기소됐다. 전문가들은 저작권 문제가 앞으로도 AI 산업의 핵심 리스크가 될 것이라고 전망하고 있다.

(그래픽=오픈AI 달리)

◇“저작권자 동의도, 보상도 없이 저작권 자료 도용”

10일(현지시간) 로이터통신 등에 따르면 브라이언 킨·압디 나제미안·스튜어트 오넌 등 소설가 세 명은 엔비디아가 네모를 학습시키는 과정에서 자신들의 소설을 무단 도용했다며 지난주 엔비디아에 집단소송을 제기했다. 이들은 지난 3년 동안 엔비디아가 네모를 학습시키는 데 사용한 모든 저작물의 미국 내 저작권자에게 불특정 손해 배상을 해야 한다고 요구했다.

원고를 대리하고 있는 조셉사베리로펌 등은 “피고가 사용한 학습 데이터세트에 원고가 쓴 책을 포함해 저작권 자료가 많이 포함돼 있으며 저작권자의 동의를 구하지도, 저작권을 명시하지도, 보상을 제공하지도 않고 (AI) 학습을 위해 복사·사용됐다”고 지적했다.

네모는 개발자가 간편하게 대형언어모델(LLM)과 생성형 AI를 구축하고 학습시킬 수 있도록 돕는 플랫폼이다. 킨 등은 엔비디아가 네모를 학습시키는 데 사용한 책 19만권 가운데 자신들의 소설도 포함됐다고 주장했다. 지난해 이들이 저작권 침해를 주장하면서 세 사람의 소설은 학습데이터 목록에서 빠진 것으로 알려졌다. 킨 등은 엔비디아가 자신들의 소설을 뒤늦게 학습데이터 목록에서 제외한 게 저작권 침해를 시인한 것이라고 내세웠다. 엔비디아는 소송에 관한 논평을 거부했다.

최근 AI 산업이 빠르게 성장하면서 AI를 고도화하기 위한 데이터 관련 분쟁도 확산하고 있다. 챗GPT 개발사인 오픈AI와 메타(페이스북) 모회사는 무단 복제 도서 데이터베이스인 ‘북(Book)3’로 AI를 학습시켰다고 피소됐다. IT 전문매체 더버지는 엔비디아 역시 북3를 이용했을 수 있다고 지적했다. 오픈AI는 이와 함께 뉴욕타임스(NYT)와도 기사 저작권 침해 문제로 송사를 치르고 있다. NYT가 주장한 피해 금액은 수십억달러. 오픈AI는 NYT 소송엔 NYT가 챗GPT를 해킹해 고의로 저작권 침해 사례를 만들었다고 주장했다.

◇“저작권 비용, AI 개발 저해” vs “인간 창의성 대체 위험”

생성형 AI의 역할이 확대되면서 저작권 침해 사례도 다양해지고 있다. 마이크로소프트와 오픈AI는 오픈소스 소프트웨어 저장소인 ‘깃허브’ 데이터를 이용해 코딩 생성 AI ‘깃허브 코파일럿’를 개발했는데 깃허브 이용자들은 권리를 침해 당했다며 집단 소송을 제기했다. 이미지 플랫폼 회사와 이미지 생성 AI 간 소송도 빈번해지고 있다.

아직 AI의 저작권 침해에 관한 판례는 많지 않다. 업계와 전문가들은 앞으로 나올 판결이 AI 업계를 포함해 사회에 큰 변화를 줄 것으로 예상한다. 벤처캐피털 안드레센호로비츠는 “AI 모델 개발사에 실제 혹은 잠재적인 저작권 이용 비용을 부과한다면 개발을 고사시키거나 크게 저해할 것”이라고 했다. AI업계에선 학습용 데이터로 저작권 자료를 이용하는 건 문화·기술 발전을 위한 ‘공정이용’에 해당하기 때문에 저작권자 허락을 받지 않아도 된다고 주장한다.

반면 창작자들은 AI에 유리한 판결이 나온다면 AI가 인간의 창의성을 대체할 것이라고 맞서고 있다. 공정이용 여부는 AI의 기능과 상업성, 학습 데이터 인용 정도에 따라 다르게 신중하게 판단해야 한다는 게 이들 생각이다.

김현경 서울과학기술대 IT정책전문대학원 교수는 “앞으로 학습 데이터 저작권 문제는 개별 AI 기업으로선 매우 중대한 리스크가 될 것”이라며 “저작권 있는 자료를 학습하는 데 비용을 지불해야 한다면 아무리 혁신적 기업이 있더라도 비용 지불 능력이 없다면 AI 사업을 하기 어려울 것”이라고 했다. 아마드 나제리 R스트리트인스티튜트 연구원은 “저작권 제도의 원래 취지를 존중하면서도 AI의 가능성을 포용하는 중간 지점을 찾는 게 인간 창의성과 AI 창의성을 동시에 발휘하게 하는 키가 될 것”이라고 말했다.