IT뉴스모아news terminal

article detail

마이크로소프트, '음성·이미지' 멀티모달 AI ‘MAI 모델 3종’ 공개...“속도·비용·현실성 모두 잡았다”

aitimes.krAI거버넌스멀티모달음성생성음성인식이미지생성
2026. 4. 3. 오전 10:30
마이크로소프트, '음성·이미지' 멀티모달 AI ‘MAI 모델 3종’ 공개...“속도·비용·현실성 모두 잡았다”

AI 요약

마이크로소프트는 2일(현지시간) 음성 인식 ‘MAI-Transcribe-1’, 음성 생성 ‘MAI-Voice-1’, 이미지 생성 ‘MAI-Image-2’ 등 차세대 멀티모달 AI 모델 3종을 발표하고, 텍스트·음성·이미지를 하나의 플랫폼에서 구현하는 전략을 본격화했습니다. 트랜스크라이브-1은 FLEURS 상위 25개 언어 기준 성능과 잡음 환경 정확도, 애저 Fast 전사 대비 약 2.5배 배치 처리 속도 향상을 강조했으며, 보이스-1은 감정·화자 정체성 유지와 1초 내 최대 60초 음성 생성, 이미지-2는 실제 서비스 환경에서 최소 2배 이상 생성 속도 향상과 시각 품질 개선을 제시했습니다. 마이크로소프트는 트랜스크라이브-1 시간당 0.36달러, 보이스-1 100만 문자당 22달러, 이미지-2 입력 100만 토큰당 5달러·출력 33달러의 가격을 공개했고, 파운드리와 MAI 플레이그라운드를 통해 배포하며 사전 테스트·레드팀 검증, 가드레일·거버넌스·엔터프라이즈 보안을 포함한 인간 중심(Humanist AI) 접근을 강조했습니다.

원문보기
feed://articles/related관련 기사
“솔직히 챗GPT 요즘 별로잖아요”…AI 홀로서기 시동거는 MS매일경제
2026. 4. 3. 오후 1:21

“솔직히 챗GPT 요즘 별로잖아요”…AI 홀로서기 시동거는 MS

독자모델음성인식음성생성이미지생성멀티모달
MS, 음성·이미지 AI 모델 첫 공개...오픈AI 벗어난다v.daum.net
2026. 4. 3. 오후 1:24

MS, 음성·이미지 AI 모델 첫 공개...오픈AI 벗어난다

음성인식음성생성이미지생성멀티모달AI자립
[테크 리뷰 ㉛] “빅테크 막내의 공짜 AI, 통할까”⋯‘메타 AI’ 써보니브릿지경제
2026. 5. 18. 오전 6:42

[테크 리뷰 ㉛] “빅테크 막내의 공짜 AI, 통할까”⋯‘메타 AI’ 써보니

AI무료서비스이미지생성멀티모달생태계확장음성인식챗봇메타
메타 AI '뮤즈 스파크' 써보니…페북·인스타에 챗GPT 심은 느낌디지털투데이
2026. 4. 10. 오전 11:41

메타 AI '뮤즈 스파크' 써보니…페북·인스타에 챗GPT 심은 느낌

AI모델멀티모달이미지생성영상생성코딩지원챗봇소셜미디어음성생성
메타, 슈퍼인텔리전스랩 첫 AI 모델 '뮤즈 스파크' 공개네이트
2026. 4. 9. 오전 5:05

메타, 슈퍼인텔리전스랩 첫 AI 모델 '뮤즈 스파크' 공개

AI모델슈퍼인텔리전스메타멀티모달벤치마크음성인식이미지생성LLM
알리바바 'Qwen시리즈' 코딩·추론·멀티모달 전방위 고도화로 글로벌 AI 경쟁 가세헬로티
2026. 4. 6. 오전 10:04

알리바바 'Qwen시리즈' 코딩·추론·멀티모달 전방위 고도화로 글로벌 AI 경쟁 가세

대형언어모델코딩에이전트멀티모달음성인식이미지생성추론능력컨텍스트윈도우옴니모달
알리바바, 스스로 코딩하고 영상 읽는 차세대 AI 모델 2종 공개cadgraphics.co.kr
2026. 4. 6. 오전 9:57

알리바바, 스스로 코딩하고 영상 읽는 차세대 AI 모델 2종 공개

AI모델멀티모달음성인식영상처리코딩자동화에이전트컨텍스트음성생성
미라 무리타 싱킹 머신즈 CEO, 다른 LLM들과 차별화를 말하다네이트
2026. 6. 8. 오후 2:21

미라 무리타 싱킹 머신즈 CEO, 다른 LLM들과 차별화를 말하다

LLM음성인식멀티모달인간중심AI협력AI대화모델AI스타트업자율성
경찰, 수사지원AI 고도화 본격화…정책자문단 위촉파이낸셜뉴스
2026. 6. 8. 오후 12:00

경찰, 수사지원AI 고도화 본격화…정책자문단 위촉

수사지원AI인공지능경찰청음성인식OCR영상분석멀티모달법령판례
경찰, 자체 AI시스템 업그레이드에 전문가 7명 자문단 위촉v.daum.net
2026. 6. 8. 오후 12:02

경찰, 자체 AI시스템 업그레이드에 전문가 7명 자문단 위촉

AI시스템수사지원음성인식OCR영상분석멀티모달자동화정책자문
'연간 접수 사건만 300만 건'…경찰, 수사지원AI자문단 출범네이트
2026. 6. 8. 오후 12:00

'연간 접수 사건만 300만 건'…경찰, 수사지원AI자문단 출범

수사지원AI인공지능경찰수사정책자문단비정형자료OCR음성인식멀티모달
"음성기록·요약 3분이면 끝"…대학생·직장인 홀린 AI필기앱네이트
2026. 6. 7. 오전 11:11

"음성기록·요약 3분이면 끝"…대학생·직장인 홀린 AI필기앱

음성인식AI필기LLM음성변환멀티모달음성처리B2B해외진출