article detail
오픈AI, 대화 알아듣는 AI 고도화…새 음성 모델 3종 출시
2026. 5. 8. 오후 2:47

AI 요약
오픈AI는 이용자와 AI의 음성 대화를 더 자연스럽게 구현하는 새 음성 AI 모델 3종인 GPT-리얼타임-2, GPT-리얼타임-트랜슬레이트, GPT-리얼타임-위스퍼를 개발자용 API에 도입한다고 7일 현지시간 공식 홈페이지를 통해 발표했습니다. GPT-리얼타임-2는 GPT-5급 추론 능력으로 대화 맥락을 이어가고 도구를 호출해 일정 확인·예약 변경·고객 응대 등 실제 작업을 수행할 수 있으며, GPT-리얼타임-트랜슬레이트는 70개 이상 입력 언어를 13개 출력 언어로 실시간 번역하고 GPT-리얼타임-위스퍼는 대화를 실시간 텍스트로 바꿔 회의 자막·회의록 작성·상담 기록 등에 활용할 수 있습니다. 오픈AI는 이번 모델들이 실시간 음성 대화를 들으며 추론하고 번역하고 글자로 바꾸며 실제 행동까지 수행하는 음성 인터페이스로 발전시키기 위한 것이며, 이번 음성 모델은 오픈AI가 지난해 인수한 아이오(Io)를 약 65억 달러에 인수해 개발 중인 음성 작동형 자체 AI 기기와도 관련될 것으로 예상된다고 밝혔습니다.


![“화면 대신 말로 다 한다”… 오픈AI가 불 지핀 스크린리스 AI 경쟁 [팩플]](https://pds.joongang.co.kr/news/component/htmlphoto_mmdata/202605/08/834c4a79-13aa-415b-ba9e-c65609073c18.jpg)



