인공지능 보조 대장내시경, 선종 발견율 높이고 불필요한 절제 줄여

이순용 기자I 2025.01.07 14:41:25

서울대학교병원 강남센터 연구팀, 약 3,000명 대상 연구 통해 AI 보조 대장내시경 시스템 효과 입증
적절한 민감도와 특이도의 균형으로 임상적 성능과 안전성 개선

[이데일리 이순용 기자] 서울대학교병원 강남센터 배정호 교수 연구팀(제 1저자: 정고은 교수)이 인공지능(AI) 보조 대장내시경 시스템에서 위양성(False, positive, 정상적인 대장주름과 점막을 용종으로 오인식하여 경보) 비율을 낮추는 것이 선종 발견률을 높이고 불필요한 용종 절제 비율을 줄이는 데 효과적이라는 연구 결과를 발표했다. 이 연구는 2021년부터 2022년까지 약 3,000명의 수진자를 대상으로 전향적 디자인으로 진행됐다.

이번 연구는 동일한 민감도(100%)를 가진 두 가지 대장내시경 인공지능 시스템(아이넥스코퍼레이션)에서, 위양성 비율이 높은 시스템 A(3.2%)와 낮은 시스템 B(0.6%)를 비교하였다. 그 결과 위양성 비율이 낮은 시스템 B가 선종 발견률과 대장내시경 당 선종 수에서 유의미하게 높은 성과를 보였다고 밝혔다. 위양성 비율이 낮은 시스템 B는 선종 발견률에서 50.4%를 보이며 표준 대장내시경(44.3%)과 위양성 비율이 높은 시스템 A(43.4%) 보다 높은 달성률을 보였다. 또한, 비종양성 용종 절제 비율을 21.3%로 억제하며, 위양성 비율 관리가 임상 성능과 효율성 향상에 중요하다는 점을 입증했다.

대장암은 전 세계적으로 세 번째로 흔한 암이며, 암 관련 사망 원인 중 두 번째를 차지한다. 선종을 포함한 전암성 용종의 발견 및 절제는 대장암 위험을 줄이는 데 핵심적이며, 대장내시경은 이를 위한 표준 절차로 자리 잡고 있다. 하지만 대장내시경은 시술자의 실력에 따라서 검사의 수행성적이 차이가 있는 것이 한계점으로 지적되고 있다. 연구팀은 인공지능 보조 대장내시경 시스템이 시술자에 따른 내시경 검사의 기술적‧인지적 한계를 극복하기 위한 가능성을 지니고 있다고 강조했다.

하지만 인공지능 시스템의 불필요한 경보가 과도하면 임상의의 집중도가 저하되어 중요한 병변에 대한 경보를 놓칠 가능성이 높아지는 “양치기 소년 효과(Crying Wolf Effect)”가 발생할 수 있다며, 적정수준의 민감도를 유지하면서 동시에 위양성 비율을 효과적으로 관리하는 것이 실질적인 임상 활용도를 높이는 핵심임을 강조했다.

세부 분석에 따르면“위양성 비율이 높은 시스템 A는 대장내시경 숙련자들에서 표준 대장내시경에 비해 선종 발견률을 저하시키는 동시에 불필요한 용종 절제를 늘여서 오히려 환자의 안전과 의료의 비용효과성에 나쁜 영향을 줄 수 있다”며, “인공지능 도입 시 실제 의료환경에서 다양한 의료진과의 상호작용이 철저히 검증되어야 한다”고 덧붙였다.

이번 연구는 인공지능 보조 시스템 개발에서 민감도와 특이도 간 균형이 중요함을 재확인하며, 의료 인공지능 기술 발전과 임상 적용 가능성에 중요한 시사점을 제공한다. 본 연구 결과는 과학 분야 세계적 권위지 네이쳐 리서치(Nature Research)의 온라인 의학 저널인 ‘디지털 메디신(npj Digital Medicine)’최신호 에 게재되었다.

연구 디자인과 주요 결과.


주요 뉴스

ⓒ종합 경제정보 미디어 이데일리 - 상업적 무단전재 & 재배포 금지