article detail
"중간에 말 끊어도 맥락 이해"…오픈AI, 새 음성모델 내놔
2026. 5. 8. 오후 5:54

AI 요약
오픈AI는 7일(현지시간) GPT-5급 추론 능력과 사람의 자연스러운 대화 양식을 반영한 음성 모델 'GPT-리얼타임-2'를 공개했으며, 이 모델은 음성 자체를 인식해 반응하고 사용자가 말을 중간에 끊거나 고쳐 말해도 자연스럽게 답한다고 밝혔습니다. 오픈AI는 실시간 번역 모델 'GPT-리얼타임-트랜슬레이트'와 실시간 받아쓰기 모델 'GPT-리얼타임-위스퍼'도 함께 선보였고 지연 시간을 획기적으로 줄였다고 설명했습니다. 오픈AI는 피지컬 AI 시대를 대비해 음성 서비스를 고도화하고 있으며 부동산 플랫폼 질로와 도이체텔레콤 등이 관련 서비스를 도입하거나 테스트 중이고, 조니 아이브의 스타트업 'io'를 지난해 65억달러에 인수한 뒤 음성 조작 AI 기기를 준비 중이라고 전해졌습니다.


![[AI 엑스포 2026-②] 피지컬 AI, 현장 투입 본격화…기술 완성도는 과제](https://cdn.epnc.co.kr/news/photo/202605/401558_401629_4113.jpg)





