IT뉴스모아news terminal

article detail

마이크로소프트, 자체 음성·이미지 AI 모델 출시…가격도 공격 모드

디지털투데이가격경쟁독자모델음성생성음성전사이미지생성
2026. 4. 2. 오후 9:18
마이크로소프트, 자체 음성·이미지 AI 모델 출시…가격도 공격 모드

AI 요약

마이크로소프트는 음성 전사(MAI-Transcribe-1), 음성 생성(MAI-Voice-1), 이미지 생성(MAI-Image-2) 등 자체 AI 모델 3종을 공개했으며, Microsoft Foundry와 MAI Playground를 통해 제공한다고 밝혔습니다. MAI-Transcribe-1은 FLEURS에서 상위 25개 언어 평균 WER 3.8%를 기록해 Whisper-large-v3 대비 25개 언어 전체, Gemini 3.1 Flash 대비 25개 중 22개 언어에서 우위를 보였고, MAI-Voice-1은 1초 내 60초 음성을 생성하며 100만자당 22달러, MAI-Image-2는 Arena.ai 리더보드 상위 3위권과 전작 대비 2배 이상 속도 향상을 기록해 텍스트 입력 100만 토큰당 5달러·이미지 출력 100만 토큰당 33달러로 책정됐습니다. 무스타파 술레이먼은 음성·이미지 모델 개발팀이 각각 10명 안팎이었다고 밝히며 아마존·구글보다 낮은 가격 책정이 의도적 결정이라고 설명했고, 마이크로소프트가 향후 LLM에서도 독자 모델을 개발해 최고 효율·최저 비용·완전 독립을 목표로 한다고 말했습니다.

원문보기
feed://articles/related관련 기사
“솔직히 챗GPT 요즘 별로잖아요”…AI 홀로서기 시동거는 MS매일경제
2026. 4. 3. 오후 1:21

“솔직히 챗GPT 요즘 별로잖아요”…AI 홀로서기 시동거는 MS

독자모델음성인식음성생성이미지생성멀티모달
MS, 음성·이미지 생성형 AI 모델 공개…“최첨단 AI 자립 이룰 것”etnews.com
2026. 4. 3. 오전 7:23

MS, 음성·이미지 생성형 AI 모델 공개…“최첨단 AI 자립 이룰 것”

생성형AI음성전사음성생성이미지생성AI자립
'절치부심' MS, 음성·이미지 AI 모델 출시..."내년엔 최첨단 기반모델 공개"v.daum.net
2026. 4. 3. 오전 4:42

'절치부심' MS, 음성·이미지 AI 모델 출시..."내년엔 최첨단 기반모델 공개"

음성전사음성생성이미지생성다국어인식기반모델
MS, 음성·이미지 AI 모델 출시…"내년엔 최첨단 기반모델 공개"매일경제 마켓
2026. 4. 3. 오전 2:18

MS, 음성·이미지 AI 모델 출시…"내년엔 최첨단 기반모델 공개"

음성전사음성생성이미지생성기반모델연산고도화
메타 AI '뮤즈 스파크' 써보니…페북·인스타에 챗GPT 심은 느낌디지털투데이
2026. 4. 10. 오전 11:41

메타 AI '뮤즈 스파크' 써보니…페북·인스타에 챗GPT 심은 느낌

AI모델멀티모달이미지생성영상생성코딩지원챗봇소셜미디어음성생성
[AI는 지금] MS, AI 자체 모델 속도전…오픈AI 의존 낮추고 멀티모달 경쟁 가속v.daum.net
2026. 4. 3. 오후 5:55

[AI는 지금] MS, AI 자체 모델 속도전…오픈AI 의존 낮추고 멀티모달 경쟁 가속

멀티모달자체모델음성전사이미지생성플랫폼생태계
[AI는 지금] MS, AI 자체 모델 속도전…오픈AI 의존 낮추고 멀티모달 경쟁 가속지디넷코리아
2026. 4. 3. 오후 5:53

[AI는 지금] MS, AI 자체 모델 속도전…오픈AI 의존 낮추고 멀티모달 경쟁 가속

멀티모달자체모델의존축소음성전사이미지생성
MS, 음성·이미지 AI 모델 첫 공개...오픈AI 벗어난다v.daum.net
2026. 4. 3. 오후 1:24

MS, 음성·이미지 AI 모델 첫 공개...오픈AI 벗어난다

음성인식음성생성이미지생성멀티모달AI자립
마이크로소프트, '음성·이미지' 멀티모달 AI ‘MAI 모델 3종’ 공개...“속도·비용·현실성 모두 잡았다”aitimes.kr
2026. 4. 3. 오전 10:30

마이크로소프트, '음성·이미지' 멀티모달 AI ‘MAI 모델 3종’ 공개...“속도·비용·현실성 모두 잡았다”

멀티모달음성인식음성생성이미지생성AI거버넌스
크몽 AI 서비스 카테고리, 9개월 만에 누적 의뢰 1만 2천 건 돌파…’AI 모델’ 검색 1위플래텀(Platum)
2026. 4. 14. 오전 10:01

크몽 AI 서비스 카테고리, 9개월 만에 누적 의뢰 1만 2천 건 돌파…’AI 모델’ 검색 1위

AI서비스AI모델이커머스패션뷰티프리랜싱이미지생성만족도
[글로벌] '수십조 인재 베팅 통했다?'...메타, 차세대 AI '뮤즈 스파크'로 반격 시동테크M
2026. 4. 11. 오후 1:54

[글로벌] '수십조 인재 베팅 통했다?'...메타, 차세대 AI '뮤즈 스파크'로 반격 시동

AI모델멀티모달추론능력이미지생성동영상벤치마크수익화오픈소스
서울공대 도재영 교수팀, 차세대 통합 AI 파운데이션 모델 ‘Dynin-Omni’ 개발동아비즈니스리뷰 | DBR
2026. 4. 8. 오후 6:35

서울공대 도재영 교수팀, 차세대 통합 AI 파운데이션 모델 ‘Dynin-Omni’ 개발

파운데이션모델멀티모달생성AI디퓨전음성처리이미지생성영상이해정보추론