article detail
“솔직히 챗GPT 요즘 별로잖아요”…AI 홀로서기 시동거는 MS
2026. 4. 3. 오후 1:21

AI 요약
마이크로소프트는 4월 2일 음성 인식·음성 생성·이미지 생성을 지원하는 ‘MAI-전사-1’, ‘MAI-음성-1’, ‘MAI-이미지-2’ 등 세 가지 모델을 공개했습니다. MS는 음성 인식 모델이 25개 주요 언어 테스트에서 챗GPT·제미나이 등 경쟁 모델과 비교해 최고 수준의 정확도를 기록했다고 밝혔고, 음성 생성은 몇 초 분량의 음성으로 특정 화자를 생성할 수 있으며 이미지 생성은 속도와 상업적 활용성을 강화했다고 설명했습니다. MS는 오픈AI와의 재협상으로 독자 모델 개발 길이 열리자 대규모 인프라를 확충하며 외부 의존 없는 자립형 AI 체제 구축을 목표로 2027년까지 텍스트·이미지·음성을 모두 처리하는 모델 확보를 추진한다고 밝혔습니다.




![[개발] 글자·사진·소리·영상 동시에 이해하고 만드는 차세대 통합 AI 파운데이션](https://elec4.co.kr/media/commonfile/202604/13/d3e665bd4817c0c6a5d801ff115cd26e.jpg)
