article detail
[비바100] “복제 넘어 연기까지”⋯AI 음성 합성, 콘텐츠 판도 바꾼다
2026. 4. 20. 오전 6:21
![[비바100] “복제 넘어 연기까지”⋯AI 음성 합성, 콘텐츠 판도 바꾼다](https://stqnq5ux4599.edge.naverncp.com/data2//content/image/2026/04/19/.cache/512/20260419500655.jpg?v=20260420063104)
AI 요약
음성 합성 기술은 시각 장애·난독증 보조에서 출발해 딥러닝과 결합하며 특정 화자의 톤과 비언어적 표현까지 복제하는 보이스 클로닝으로 발전했으며, 글로벌 TTS 시장은 2022년 29억 달러(약 4조 2566억원)에서 2032년 111억 달러(약 16조 2925억원)로 성장할 것으로 전망됩니다. 구글은 지난 15일(현지시간) 맥락에 맞는 감정 표현을 구현하는 TTS 모델 ‘제미나이 3.1 플래시 TTS’를 공개했으며, 오디오 태그로 속도·어조·억양을 조정하고 70개 이상 언어를 지원해 아티피셜 애널리시스 TTS 벤치마크에서 1211점을 기록했습니다. 영국 기업 일레븐랩스는 월간활성이용자수 5000만명, 포춘 500대 기업 중 75%를 고객으로 두고 올해 2월 시리즈D로 기업가치 110억 달러를 인정받았으며 Eleven v3는 70개 이상 언어의 실시간 음성 합성과 비언어적 표현을 지원하고 아이코닉 보이스에는 28명의 목소리가 등록돼 글로벌 마켓플레이스에 1만개 이상의 음성이 올라와 제공자들이 약 1100만 달러의 수익을 받았다고 밝혔습니다.








