article detail
오픈AI, API에 실시간 음성 번역·전사 기능 추가… “대화하면서 일하는 AI”
2026. 5. 8. 오후 9:35

AI 요약
오픈AI가 API에 세 가지 새로운 음성 인텔리전스 기능을 추가했습니다: GPT-리얼타임-2는 GPT-리얼타임-1.5의 후속으로 GPT-5급 추론 능력을 탑재해 대화 중 복잡한 요청을 처리하고 실질적 작업을 수행하는 것을 목표로 하며, GPT-리얼타임-트랜스레이트는 70개 이상 입력 언어를 이해해 13개 출력 언어로 실시간 변환하고 사용자의 대화 속도에 맞춰 작동하며, GPT-리얼타임-위스퍼는 대화 중 음성을 텍스트로 실시간 전사합니다. 세 모델은 오픈AI의 Realtime API를 통해 제공되며 GPT-리얼타임-2는 토큰 소비량 기준으로, 트랜스레이트와 위스퍼는 분 단위로 과금되고 고객 서비스·교육·미디어·이벤트·크리에이터 플랫폼 등 다양한 분야에 적용 가능하며 가이드라인 위반이 감지되면 대화를 중단하는 안전장치를 내장했습니다. 이 조치는 딥그램(1억3000만 달러 유치)과 일레븐랩스(시리즈D 5억 달러·기업가치 110억 달러) 등 전문 음성 AI 스타트업과의 직접 경쟁을 의미합니다.


![“화면 대신 말로 다 한다”… 오픈AI가 불 지핀 스크린리스 AI 경쟁 [팩플]](https://pds.joongang.co.kr/news/component/htmlphoto_mmdata/202605/08/834c4a79-13aa-415b-ba9e-c65609073c18.jpg)




