|
[이데일리 김국배 기자] “통상 데이터셋(데이터 집합)에 1%의 오류가 있으면 인공지능(AI) 성능은 평균 3~4% 떨어집니다. 현재 진행되는 많은 데이터 사업이 고품질 데이터셋 구축에 집중되는 이유이기도 합니다.”
23일 이데일리와 지능정보산업협회가 주최한 ‘AI코리아 대상’에서 AI 기술상인 과학기술정보통신부 장관상을 받은 인피닉의 박준형 대표는 “AI 개발 과정을 보면 기술이 고도화됨에 따라 기존 데이터셋을 전혀 활용하지 못하고 폐기하는 경우가 많다”며 “데이터셋의 활용성을 높여주는 게 우리의 일”이라고 말했다.
데이터셋은 AI를 학습시키기 위해 모아놓은 데이터다. 데이터셋의 품질이 AI의 성능을 좌우한다고 해도 과언이 아니다. 박 대표에 따르면, 현재 데이터 산업에서 나타나고 있는 문제점 중 하나는 자율주행처럼 AI 기술이 지속적으로 업그레이드되는 경우 기존 데이터셋을 못 쓰게 되는 일이 부지기수라는 것.
인피닉은 이런 문제를 해결하기 위해 ‘데이터 스튜디오’라는 이름의 데이터옵스 프레임워크 기술을 내놨다. 쉽게 말해 AI에 필요한 데이터를 생애주기에 맞춰 관리, 운영할 수 있게 해주는 기술이다. ‘센서 퓨전’ 등 10개의 핵심 기술로 구성된다. 관련 특허만 100건이 넘는다. 그는 “어떻게 개별 데이터셋을 효과적으로 운영, 통합, 재배포할 것인지 고민을 담은 기술”이라고 했다.
데이터 스튜디오는 베이직, 프리미엄, 엔터프라이즈 등 3가지 서비스로 구분된다. 베이직은 초기 개발이나 프로젝트성 솔루션을 구축할 때 적합하다. 프리미엄은 고품질에 ‘타깃팅’해 제공되며, 엔터프라이즈의 경우 운영에 초점을 맞춘다. 박 대표는 “현재 주력하고 있는 자율주행 분야를 넘어 국방, 항공우주 등 다른 산업 분야로 확장하려 한다”며 “기술 측면에서 보면 하나의 기술이 수평적으로 전개되는 셈”이라고 말했다.
해외 시장 진출 기회도 찾는다. 2018년 베트남 법인을 세운 인피닉은 2020년에도 코로나를 뚫고 유럽 법인을 설립했다. 북미와 중국, 베트남에도 거점을 두고 있다. 박 대표는 “데이터옵스는 국내 뿐 아니라 해외에서도 적용되고 경쟁력을 갖을 수 있는 기술이라 판단한다”며 “해외에서도 우리나라 AI 기술의 우수성을 알리고 성과를 구현하는 기업이 되도록 계속 노력하겠다”고 말했다.
2005년 설립한 인피닉은 연구개발 인력을 집중적으로 고용하고 있다. 현재 연구소 인력만 58명이다. 연구자들이 발표한 논문도 29건이나 된다. 두 달 내 4건의 논문이 더 발표될 예정이다. 인피닉의 고객사는 약 105곳이다. 현재까지 구축한 데이터는 10억건이다. 이미지 기준으로 하면 9200만장 수준이라고 한다. 정부의 데이터댐 구축 사업을 통해 일부 개방하기도 했다. 박 대표는 “민간에서 구축하기 어려운 분야의 데이터를 선제적으로 개방해 AI 발전에 기여하고자 한다”고 말했다.
|