“AI 병원균 설계 점점 능숙해져”…생물테러 진입 장벽 낮아지나

[이데일리 방성훈 기자] 인공지능(AI)이 바이오 테러의 진입 장벽을 빠르게 낮추고 있어 우려가 커지고 있다. 병원균 설계에 점점 능숙해지고 있어서다. 과학적 배경이 거의 없는 일반인도 거대언어모델(LLM)의 도움을 받으면 치명적 병원체 설계에 다가설 수 있다는 평가가 잇따르면서, 오픈AI·앤스로픽·구글 등 주요 AI 기업들은 안전 장치를 강화하고 있다.

(사진=AFP)

이코노미스트는 5일(현지시간) “주요 AI 모델들이 점점 더 능숙하게 병원체 설계를 도울 수 있게 됐다”고 보도했다. 영국 AI안보연구소(AISI)는 지난해 12월 공개한 보고서에서 “주요 LLM이 유전자 조각으로부터 바이러스·박테리아를 합성하는 과학적 절차를 안정적으로 생성할 수 있다”고 지적했다. 같은 달 미 싱크탱크 랜드연구소(RAND) 연구진도 상용 모델이 폴리오바이러스 RNA 조립의 가장 까다로운 단계를 도울 수 있다고 입증했다.

비영리 단체 시큐어바이오의 바이러스학 평가 시험에서는 최신 LLM들이 단독으로 55~61점을 기록, 최고 수준 인간 바이러스학자 팀과 동등한 점수를 받았다. 전문가 약 36명의 평균 점수가 22점이었던 점을 감안하면 압도적인 결과다. 생물학 초보자가 LLM을 활용하는 경우에도 전문가들보다 높은 평균 28점을 기록했다. 이에 앤스로픽은 자사 LLM이 과학적 배경이 부족한 사람의 생물무기 개발을 도울 가능성을 더는 배제할 수 없다고 인정한 상태다.

실제 실험실에서의 위험은 아직 제한적이라는 반박도 나온다. 비영리 단체 액티브사이트가 지난 2월 발표한 무작위 대조 시험에서 생물학 경험이 거의 없는 153명에게 AI를 활용해 바이러스 생산 관련 과제를 수행하도록 한 결과, 핵심 과제를 완수한 것은 4명에 그쳤다. 인터넷만 쓴 대조군(5명)보다 오히려 적은 수준이다.

연구 책임자 조 토레스는 “LLM이 그럴듯해 보이지만 틀린 답을 빠르게 내놓는 경우가 많아 실험을 망쳤다”며 “참가자들이 가장 유용하다고 꼽은 자료는 유튜브였다”고 전했다.

박사급 전문가가 활용할 경우 결과는 달라질 수 있다. 앤스로픽 자체 평가에서 AI 모델 미토스(Mythos)와 오푸스(Opus)가 박사급 바이러스학 전문가의 작업 속도를 크게 높이고 더 나은 실험 절차를 만들어내는 것으로 나타났다. 다만 모든 절차에 실제 실험을 실패로 이끌 치명적 오류가 포함돼 있었다.

‘환각’과 ‘과잉 확신’도 약점이다. 앤스로픽 평가에서 모델은 인간 전문가가 비현실적 아이디어를 제시할 때 다른 방안을 제안하기보다 그 아이디어를 부추기는 경향을 보였다. 한 평가자는 “미토스가 제시한 절차에는 반드시 실패하게 만드는 단계가 들어 있었다”고 지적했다.

문제는 기술 진보 속도다. 미 국방부가 자금을 지원하는 연구는 LLM과 유사하게 뉴클레오티드 서열을 생성하는 ‘생물 설계 도구’가 머지않아 병원체의 독성·전염력·치료 저항성을 강화할 수 있다고 경고했다.

실제로 액티브사이트가 후속 연구 결과를 발표하기까지 6개월 동안 생물학 능력이 향상된 첨단 모델이 4개나 새로 출시됐다. 안전성 평가가 모델 출시 속도를 따라잡지 못하고 있다는 의미다.

이코노미스트는 “개발사들이 신모델 출시 속도를 늦춰야 할 수도 있다”고 지적했다. 앤스로픽은 지난달 사이버 보안 분야 세계 최고 수준 자사 모델 미토스의 위험이 해결될 때까지 접근을 제한한다고 발표한 바 있다.