ElevenLabs, AI 더빙 v2 출시 — 90개 언어에서 목소리·감정·타이밍 그대로
한 줄 요약: ElevenLabs가 텍스트 변환 없이 원본 오디오 퍼포먼스를 직접 분석해 90개 이상 언어로 재현하는 AI 더빙 모델 v2를 출시했다.
핵심
- 기술 접근: 기존 ASR → 번역 → TTS 파이프라인 대신, 원본 오디오에서 감정·억양·속도·멈춤을 직접 학습 후 목표 언어로 재현
- 지원 언어: 90개 이상 언어/방언, 자동 보이스 클로닝(음색·톤·피치 포함)
- 출력 동기화: 번역 음성이 원본 영상 타이밍에 자동 정렬
- 출시: 2026년 5월 28일 GA, ElevenCreative 및 ElevenProductions에서 이용 가능
왜 중요한가
콘텐츠 현지화는 번역 품질만큼이나 "같은 사람처럼 들리는가"가 핵심 과제였다. Dubbing v2는 화자 아이덴티티를 유지한 채 90개 언어에서 자동 더빙을 가능하게 해 유튜브·오디오북·팟캐스트·기업 교육 콘텐츠의 글로벌 배포 비용을 크게 낮출 수 있다.
더 보기
- Introducing Dubbing v2 — ElevenLabs 공식 블로그
- ElevenLabs Dubbing v2 Launches With 90+ Languages — aiHola