두바이의 음성 인공지능(AI) 스타트업 캄AI가 140개 이상의 언어를 지원하는 음성 복제 모델을 출시했다. 목소리 뿐만 아니라 리듬, 감정, 억양을 모방하는 더 높은 수준의 현실감을 차별점으로 내세웠다.
벤처비트는 11일(현지시간) 스타트업 캄AI가 음성 복제 모델 ‘마스5(Mars5)’를 출시했다고 보도했다.
이에 따르면 마스5는 음성 AI 선두인 일레븐랩스가 지원하는 36개 언어보다 3배 많은 140개 이상의 언어를 지원한다. 단 몇 초의 입력만으로 음성 뿐만 아니라 리듬, 감정, 억양까지 복제한다. 영어 전용 버전은 깃허브에서 오픈 소스로 제공하며, 언어 지원이 확장된 버전은 유료 캄 스튜디오에서 사용할 수 있다.
중략
현재 마스5와 볼리는 캄AI의 플랫폼인 캄 스튜디오에서 140개 언어와 함께 작동한다. 또 이러한 기능을 기업, 중소기업 및 개발자에게 API로 제공하고 있다. 프라카시 CTO는 고객 수를 정확히 공유하지는 않았지만 “메이저 리그 사커, 테니스 오스트레일리아, 메이플 리프 스포츠 & 엔터테인먼트, 주요 영화 및 음악 스튜디오, 몇몇 정부 기관과 협력하고 있다”라고 밝혔다.
메이저 리그 사커의 경우, 캄 AI는 최초로 2시간 이상 연속으로 게임을 네개의 언어로 실시간으로 더빙하여 중단 없이 방영했다. 또 호주 오픈의 경기 후 기자회견을 여러 언어로 번역하고, 심리 스릴러 영화 ‘쓰리(Three)’를 아랍어에서 중국어로 번역했다.
전문보기(출처) - https://www.aitimes.com/news/articleView.html?idxno=160565
0/2000자