카이스트 홍승훈 교수 연구팀, ‘ICLR’ 학술대회서 韓최초 최우수논문상

KAIST 전산학부 홍승훈 교수(왼쪽부터), 김동균 박사과정이 포즈를 취하고 있다. (사진=KAIST)

[이데일리 김정유 기자] 카이스트(KAIST)는 전산학부 홍승훈 교수 연구팀이 최근 열린 기계학습 분야 최우수 국제학술대회인 ‘표현 학습 국제 학회 2023’(이하 ICLR 2023)에서 최우수논문상을 수상했다고 5일 밝혔다.

ICLR 2023은 인공지능(AI) 분야의 가장 권위 있는 학회 중 하나다. 올해 최우수논문상은 전체 1574편의 논문 중 상위 4편에 주어졌다.

홍 교수팀의 ICLR 최우수논문상 수상은 한국인으로서는 최초다. 또한 주요 기계학습 학회에서 국내 기관이 주축이 돼 진행한 연구로 최우수논문상을 수상한 최초 사례이기도 하다.

KAIST 전산학부 김동균 박사과정(제1 저자), 김진우 박사과정, 조성웅 석사과정과 마이크로소프트 리서치 아시아의 총 루오 박사로 구성된 홍승훈 교수 연구팀은 컴퓨터 비전 분야의 핵심 연구 주제인 ‘픽셀 레이블링 문제’를 획기적으로 적은 수의 데이터로 해결할 수 있는 범용적 방법론 ‘비주얼 토큰 매칭’(Visual Token Matching) 기법을 제안했다.

픽셀 레이블링은 물체 검출, 물체 분할, 자세 추정, 깊이 추정, 3차원 복원 등 컴퓨터 비전 분야의 모든 핵심 문제를 광범위하게 아우르는 개념이다. 최근 10년간 신경망 기반 기계학습 방법론이 적용되며 픽셀 레이블링의 다양한 세부 문제에서 진전이 있었지만, 이같은 방법들은 수십만개 이상의 방대한 학습 데이터를 요구하는 한계가 있었다.

홍승훈 교수 연구팀은 모든 종류의 픽셀 레이블링 문제에 대해 수십개 이내의 적은 데이터로도 학습과 추론이 가능한 범용적인 퓨샷 학습 기법을 개발했다. 수많은 픽셀 레이블링 문제에서 기존 방법 대비 0.01% 이내의 데이터로도 비슷하거나 우수한 성능을 낼 수 있음을 입증했다.

홍 교수는 이번 연구를 통해 의료 영상처럼 학습 데이터 수집이 병목되는 다양한 도메인에서 컴퓨터 비전 기술을 적용하는데 돌파구가 되기를 기대한다고 평가했다.

이번 연구를 주도한 김동균 박사과정은 적은 수의 데이터로 학습할 수 있는 범용적 기계학습 방법론을 계속 연구해 왔으며, 이의 이론적 토대가 되는 연구를 지난 ICLR에 출판한 바 있다. 김동균 박사과정은 이번 연구로 삼성 휴먼테크 논문대상에서 은상을 수상하기도 했다.

홍 교수는 “상을 받게 되어 영광이고, 이번 수상이 국내 기계학습 연구자들에게 자신감이 되어 한국에서 더 많은 도전적인 연구들이 나오는 데 도움이 된다면 기쁠 것 같다”고 밝혔다.