article detail
구글, 차세대 AI 음성 모델 ‘제미나이 3.1 플래시 TTS’ 공개…음성 “연출 가능한 시대” 진입, 말의 감정까지 조절한다
2026. 4. 16. 오후 12:13
AI 요약
구글은 15일(현지시간) 차세대 TTS 모델 제미나이 3.1 플래시 TTS를 공개하며 음성 품질, 표현력, 제어 가능성이 크게 개선됐다고 발표했습니다. 이 모델은 Elo 점수 1,211을 기록하고 자연어 지시문으로 말투·속도·감정 등을 세밀하게 제어하는 오디오 태그와 멀티 스피커·캐릭터·장면 설정 기능, 70개 이상의 언어 지원을 제공하며 개발자는 제미나이 API·Google AI Studio, 기업은 Vertex AI, 일반 사용자는 Google Vids를 통해 이용할 수 있습니다. 생성된 모든 음성에는 신스아이디(SynthID) 기반 워터마크가 삽입되어 AI 생성 콘텐츠 여부를 추적하도록 설계됐습니다.


![[테크스냅] 이노그리드, 'AI 클라우드 기술개발 사업' 주관기관 선정](https://img1.yna.co.kr/etc/inner/KR/2026/04/16/AKR20260416075100017_01_i_P4.jpg)

![로보택시에 갇히고 업무스킬 복제해 직원 해고… ‘AI실험장’된 대륙[박세희의 ‘차이나 스캔’]](https://wimg.munhwa.com/news/cms/2026/04/16/news-p.v1.20260415.219c176f46bf4eb6ab6468bb3d2b9a40_R.jpg)



