|
API(Application Programming Interface)는 서로 다른 소프트웨어 간 데이터를 주고받고 기능을 공유할 수 있는 일종의 디지털 연결고리다. 개발자들이 다른 서비스에서 제공하는 데이터나 기능을 가져와 자사 서비스에 내재화하는데 활용한다.
가장 먼저 API로 제공되는 AI 음성 기술은 텍스트를 음성으로 변환하는 ‘Text-to-Speech’(TTS) 기술이다. 수퍼톤이 자체 개발한 파운데이션 모델 낸시(NANSY, Neural Analysis & Synthesis)가 적용된 수퍼톤의 TTS 기술은 자연스럽고 풍부한 감정까지 가능한 음성을 만들어내는 것이 특징이다. 낸시를 통해 목소리를 음색?발음?음고?강세 등 4개의 구성 요소로 분석하고, 이를 개별적으로 제어해 실제 사람의 발화에 가까운 목소리를 구현할 수 있다.
TTS API는 대화형 게임 캐릭터 제작이나 오디오북, 애니메이션, 채팅 서비스 등 TTS 기술이 필요한 곳 어디서나 이용할 수 있다. 특히 수퍼톤은 기존 낸시 모델을 개선해 텍스트가 음성으로 출력되는 시간을 줄였다. 이에 챗봇 같이 즉각적인 음성 피드백이 필요한 서비스 개발이 용이하도록 했다.
이번 API 공개에 앞서 수퍼톤은 인터랙티브 AI 콘텐츠 플랫폼 ‘제타(zeta)’를 운영하는 스캐터랩과 협업해 TTS 기술을 API로 제공하고 있다. 지난달 초 제타는 이용자가 직접 AI 챗봇 캐릭터를 제작하고, 목소리를 부여할 수 있는 기능을 선보였는데, 이때 수퍼톤의 TTS 기술이 연동돼 서비스 이용 만족도를 높였다.
앞으로 수퍼톤 API에는 TTS 기술 뿐만 아니라, 가창 합성 음성 기술이나 음성 변환 기술 등도 추가될 예정이다.
이교구 수퍼톤 대표는 “수퍼톤 API는 수퍼톤 AI 음성 기술들의 활용도를 넓히고 상용화하는 계기가 될 것”이라며 “비즈니스 파트너사 뿐만 아니라 1인 또는 소규모 콘텐츠 크리에이터들도 수퍼톤 AI 음성 기술들을 더 자연스럽고 몰입감 있는 인터랙티브 콘텐츠 등에 폭넓게 적용할 수 있을 것”이라고 말했다.