IT뉴스모아news terminal

article detail

“中 사투리·억양 완벽 포착”... 알리바바 AI 음성 모델, 美 오픈AI 제치고 세계 탑5 진입

글로벌이코노믹AI음성모델B2B서비스방언인식실시간처리음성기술음성생성음성인식중국AI
2026. 5. 31. 오전 5:50
“中 사투리·억양 완벽 포착”... 알리바바 AI 음성 모델, 美 오픈AI 제치고 세계 탑5 진입

AI 요약

사우스차이나모닝포스트(SCMP) 보도에 따르면 알리바바 그룹 홀딩의 통이 랩(Tongyi Lab)이 개발한 실시간 음성 생성 모델 Fun-Realtime-TTS-Preview가 인공분석(Artificial Analysis) 음성 아레나 리더보드에서 1,190점을 획득해 전 세계 5위에 올랐고 중국산 시스템으로는 유일하게 상위 5위권에 진입했습니다. 이 모델은 전 세계 30개 이상의 언어와 중국 내 7대 주요 방언 및 20개 이상의 지역 사투리와 억양을 지원하며, 함께 공개된 음성 인식 모델 Fun-Realtime-ASR은 인공분석 단어 오류율 1.8%로 세계 1위를 기록했습니다. 알리바바는 금융·의료업계에 맞춤형 B2B 인터페이스를 즉시 공급하기 시작했으며 의료 현장의 구두 음성 노트를 실시간으로 구조화된 임상 기록으로 자동 변환하고 별도 교육 없이도 복잡한 사투리를 사용하는 현장 음성을 비즈니스 데이터로 즉각 자산화할 수 있다고 밝혔습니다.

원문보기
feed://articles/related관련 기사
오픈AI, 실시간 음성 AI 경쟁 본격화...새 오디오 모델 3종 공개레디앙
2026. 5. 8. 오전 11:04

오픈AI, 실시간 음성 AI 경쟁 본격화...새 오디오 모델 3종 공개

음성AI실시간처리오디오모델음성인식음성인터페이스AI에이전트음성기술멀티모달AI
대우건설, ‘건설 특화 실시간 AI 번역기’ 개발IT조선
2026. 6. 1. 오전 10:48

대우건설, ‘건설 특화 실시간 AI 번역기’ 개발

AI번역기건설기술음성인식외국인근로자현장관리용어사전실시간처리
25달러 vs 1.15달러…中 AI, B2B 시장 파고든다한국경제
2026. 5. 28. 오후 5:52

25달러 vs 1.15달러…中 AI, B2B 시장 파고든다

생성형AIB2B시장중국AI멀티모달AI에이전트영상생성음성생성가격경쟁
"살려주세요" 바다 위 조난음성, AI가 듣는다...해경청, AI 기반 구조 시스템 개발 착수한국방송뉴스
2026. 5. 26. 오후 12:44

"살려주세요" 바다 위 조난음성, AI가 듣는다...해경청, AI 기반 구조 시스템 개발 착수

AI음성인식해상안전긴급대응조난신호자동식별오류감소실시간처리
온디바이스 AI 기업 아웃오브셋, 시드 투자로 모델 학습 인프라 구축 본격화아시아경제
2026. 5. 20. 오전 8:38

온디바이스 AI 기업 아웃오브셋, 시드 투자로 모델 학습 인프라 구축 본격화

온디바이스AI음성인식음성합성모델학습벤처투자경량모델음성기술인프라구축
[AI Frontier] 리드스피커코리아(ReadSpeakerKorea), ‘듣는 AI’로 웹 접근성 시장 공략mstoday.co.kr
2026. 5. 9. 오전 10:17

[AI Frontier] 리드스피커코리아(ReadSpeakerKorea), ‘듣는 AI’로 웹 접근성 시장 공략

음성합성음성인식웹접근성AI음성음성인터페이스실시간자막음성기술콜센터
“듣고, 추론하고, 번역하고, 행동한다”…오픈AI, 차세대 실시간 음성 AI 모델 3종 공개인공지능신문
2026. 5. 8. 오전 9:00

“듣고, 추론하고, 번역하고, 행동한다”…오픈AI, 차세대 실시간 음성 AI 모델 3종 공개

음성AI실시간처리음성모델음성번역음성인식추론능력API멀티모달
오픈AI, 실시간 음성 AI모델 공개…“자연스러운 대화 행태 반영”전자신문
2026. 5. 8. 오전 7:30

오픈AI, 실시간 음성 AI모델 공개…“자연스러운 대화 행태 반영”

음성AI실시간처리추론능력자연언어처리AI기기음성인식번역모델받아쓰기
[비바100] “복제 넘어 연기까지”⋯AI 음성 합성, 콘텐츠 판도 바꾼다브릿지경제
2026. 4. 20. 오전 6:21

[비바100] “복제 넘어 연기까지”⋯AI 음성 합성, 콘텐츠 판도 바꾼다

AI음성합성보이스클로닝TTS딥러닝음성기술콘텐츠제작감정표현실시간처리
iFLYTEK, GITEX ASIA 2026에서 ‘AI 안경’과 ‘AI 통역 마이크’ 선보이며 전방위적 AI 번역 솔루션 강조뉴스와이어
2026. 4. 10. 오전 9:21

iFLYTEK, GITEX ASIA 2026에서 ‘AI 안경’과 ‘AI 통역 마이크’ 선보이며 전방위적 AI 번역 솔루션 강조

AI안경AI통역음성인식실시간번역멀티모달음성기술번역생태계언어장벽
오아시스마켓, AI 비서 메이로 대기 없는 차세대 고객센터 오픈헬로티
2026. 4. 9. 오전 11:48

오아시스마켓, AI 비서 메이로 대기 없는 차세대 고객센터 오픈

AI비서음성인식고객센터자동응대커머스무인계산AI도입실시간처리
알리바바, 스스로 코딩하고 영상 읽는 차세대 AI 모델 2종 공개cadgraphics.co.kr
2026. 4. 6. 오전 9:57

알리바바, 스스로 코딩하고 영상 읽는 차세대 AI 모델 2종 공개

AI모델멀티모달음성인식영상처리코딩자동화에이전트컨텍스트음성생성