앤디 재시 아마존 CEO는 3일(현지시간) 라스베이거스에서 열린 AWS 연례 기술 콘퍼런스 ‘AWS 리인벤트’ 기조연설을 통해 “아마존 노바는 진보된 지능을 갖춘 최신 파운데이션 모델”이라고 소개했다.
노바는 텍스트 전용 모델 1개, 멀티모달 모델 3개, 이미지 생성 모델과 동영상 생성 모델을 포함한 총 6개의 모델로 구성된다. 텍스트 전용 모델인 ‘노바 마이크로’는 빠르고 비용 효율적이며 간단한 텍스트 작업에 최적화됐다. 멀티모달 모델은 크기와 지능 수준에 따라 라이트(Light), 프로(Pro), 프리미어(Premier) 3가지로 구분되며, 마이크로, 라이트, 프로 모델은 즉시 사용 가능하고, 프리미어 모델은 내년 1분기에 출시될 예정이다.
|
아마존의 자체 벤치마크 결과에 따르면, 각 노바 모델은 동급 경쟁 모델과 비슷하거나 더 우수한 성능을 보였다. 노바 마이크로는 라마 8B와 비교해 모든 항목에서 우수했으며, 제미나이 1.5 플래시-8B와 비교해 더 나은 성능을 보였다. 노바 라이트는 GPT-4o 미니와 비교해 19개 벤치마크 중 17개에서 동등하거나 우수한 성능을 보였고, 제미나이 1.5 플래시와 비교해도 21개 중 17개에서 더 나은 성능을 기록했다. 노바 프로는 클로드 3.5소네트와 비교해 절반의 항목에서 동등하거나 더 나은 성능을 보였다.
노바의 경쟁력은 저렴한 비용과 빠른 속도에 있다. 재시 CEO는 “노바는 경쟁 모델들보다 약 75% 더 저렴하고, 지연 시간도 가장 빠르다”며, “이 장점 덕분에 사용자는 비용 절감과 고속 처리 능력을 동시에 누릴 수 있다”고 강조했다.
|
|
또한, 노바는 AWS AI 개발 플랫폼인 베드록과 깊이 통합돼 강점으로 작용한다. 재시 CEO는 “노바는 베드록의 지식 기반과 밀접하게 연결돼 있으며, 검색증강생성(RAG) 기능을 통해 사용자 데이터를 바탕으로 답변을 강화할 수 있다”고 설명했다. 그는 “이 기능은 AI 모델을 더욱 효율적이고 사용자 맞춤형으로 활용할 수 있게 해주며, 비용과 성능 면에서도 최적의 선택지를 제공한다”고 덧붙였다.
아마존은 이미지 생성 모델인 ‘노바 캔버스’도 공개했다. 사용자는 자연어 텍스트를 입력하면 스튜디오 품질의 이미지를 생성할 수 있으며, 텍스트를 통해 이미지 편집과 색상, 레이아웃 제어가 가능하다. 워터마크와 콘텐츠 조정 기능을 통해 콘텐츠 추적 및 유해한 콘텐츠 생성을 제한할 수 있다. 아마존의 자체 벤치마크에서 캔버스는 DALL-E 3와 스테이블 디퓨전 3.5와 비교해 ‘이미지 품질’과 ‘명령어 준수’ 면에서 우수한 성능을 보였다.
동영상 생성 모델인 ‘노바 릴(Nova Reel)’은 스튜디오 품질의 동영상을 제작하며, 카메라 제어 기능으로 모션, 팬닝, 360도 회전, 줌을 지원한다. 출시 초기에는 6초 분량의 동영상을 제작할 수 있으며, 마케팅이나 광고에 활용될 수 있다. 향후 몇 달 내에 최대 2분 길이의 동영상 제작도 지원할 예정이다. 재시 CEO는 “내년 1분기에는 음성을 입력하면 음성으로 답변을 제공하는 ‘스피치 투 스피치’ 모델을, 내년 중반에는 ‘애니 투 애니’ 모델을 선보여 텍스트, 음성, 이미지, 비디오 등 다양한 형태의 입출력이 가능하게 할 것”이라고 밝혔다.
노바는 타이탄에 이어 아마존이 새롭게 선보인 파운데이션 모델이다. 아마존이 자체 파운데이션 모델을 지속적으로 출시하는 이유는 고객에게 더 많은 선택지를 제공하기 위해서라고 재시 CEO는 설명했다. 그는 “다양한 모델들이 코드 작성, 수학 연산, RAG 통합, 에이전트 요구사항, 낮은 지연 시간, 비용 효율성 등 다양한 고객 상황에 맞춰 활용될 수 있다”며, “가장 큰 장점은 모든 모델이 베드락에서 제공돼 원하는 조합으로 사용할 수 있다는 점”이라고 강조했다.