IT뉴스모아news terminal

article detail

오픈AI, API에 실시간 음성 번역·전사 기능 추가… “대화하면서 일하는 AI”

와우테일API경쟁심화다국어지원실시간번역음성AI음성인식음성전사추론능력
2026. 5. 8. 오후 9:35
오픈AI, API에 실시간 음성 번역·전사 기능 추가… “대화하면서 일하는 AI”

AI 요약

오픈AI가 API에 세 가지 새로운 음성 인텔리전스 기능을 추가했습니다: GPT-리얼타임-2는 GPT-리얼타임-1.5의 후속으로 GPT-5급 추론 능력을 탑재해 대화 중 복잡한 요청을 처리하고 실질적 작업을 수행하는 것을 목표로 하며, GPT-리얼타임-트랜스레이트는 70개 이상 입력 언어를 이해해 13개 출력 언어로 실시간 변환하고 사용자의 대화 속도에 맞춰 작동하며, GPT-리얼타임-위스퍼는 대화 중 음성을 텍스트로 실시간 전사합니다. 세 모델은 오픈AI의 Realtime API를 통해 제공되며 GPT-리얼타임-2는 토큰 소비량 기준으로, 트랜스레이트와 위스퍼는 분 단위로 과금되고 고객 서비스·교육·미디어·이벤트·크리에이터 플랫폼 등 다양한 분야에 적용 가능하며 가이드라인 위반이 감지되면 대화를 중단하는 안전장치를 내장했습니다. 이 조치는 딥그램(1억3000만 달러 유치)과 일레븐랩스(시리즈D 5억 달러·기업가치 110억 달러) 등 전문 음성 AI 스타트업과의 직접 경쟁을 의미합니다.

원문보기
feed://articles/related관련 기사
오픈AI, 대화 알아듣는 AI 고도화…새 음성 모델 3종 출시MTN 머니투데이방송
2026. 5. 8. 오후 2:47

오픈AI, 대화 알아듣는 AI 고도화…새 음성 모델 3종 출시

음성AI실시간번역음성인식추론능력API자동응답음성인터페이스멀티모달AI
오픈AI, 고쳐 말해도 바로 이해하는 AI 공개한국경제
2026. 5. 8. 오후 5:39

오픈AI, 고쳐 말해도 바로 이해하는 AI 공개

음성AI추론능력실시간번역음성인식텍스트생성광고서비스챗봇
“화면 대신 말로 다 한다”… 오픈AI가 불 지핀 스크린리스 AI 경쟁 [팩플]중앙일보
2026. 5. 8. 오후 2:25

“화면 대신 말로 다 한다”… 오픈AI가 불 지핀 스크린리스 AI 경쟁 [팩플]

음성AI스크린리스실시간대화음성인식자연어처리API음성통역추론능력
“듣고, 추론하고, 번역하고, 행동한다”…오픈AI, 차세대 실시간 음성 AI 모델 3종 공개인공지능신문
2026. 5. 8. 오전 9:00

“듣고, 추론하고, 번역하고, 행동한다”…오픈AI, 차세대 실시간 음성 AI 모델 3종 공개

음성AI실시간처리음성모델음성번역음성인식추론능력API멀티모달
오픈AI, 실시간 음성 AI모델 공개…새 AI기기 출시 포석인듯v.daum.net
2026. 5. 8. 오전 4:08

오픈AI, 실시간 음성 AI모델 공개…새 AI기기 출시 포석인듯

음성AI실시간번역음성인식추론능력스마트기기정신건강챗봇음성조작
딥엘, 실시간 음성 간 번역 ‘보이스 투 보이스’ 공개…글로벌 비즈니스언어 장벽 해소 지원인공지능신문
2026. 4. 16. 오전 10:30

딥엘, 실시간 음성 간 번역 ‘보이스 투 보이스’ 공개…글로벌 비즈니스언어 장벽 해소 지원

음성번역실시간번역AI번역음성인식다국어지원API언어모델
글로벌 AI 통역 딥엘 “화자 목소리 본뜬 음성 솔루션 선뵐 것”…韓시장 공략 본격화디지털데일리
2026. 4. 16. 오전 9:00

글로벌 AI 통역 딥엘 “화자 목소리 본뜬 음성 솔루션 선뵐 것”…韓시장 공략 본격화

AI통역음성합성실시간번역다국어지원음성솔루션한국시장API음성인식
일레븐랩스, ‘AI 엑스포’서 음성 AI 에이전트 공개… “0.5초 내 응답”산업일보
2026. 5. 9. 오전 10:00

일레븐랩스, ‘AI 엑스포’서 음성 AI 에이전트 공개… “0.5초 내 응답”

음성AI에이전트음성인식STTCRM연동다국어지원개인정보보호음성합성
아이나비모빌리티, 외국인 전용 AI 택시 호출 플랫폼 확대v.daum.net
2026. 5. 8. 오후 2:53

아이나비모빌리티, 외국인 전용 AI 택시 호출 플랫폼 확대

AI택시호출음성인식자연어처리다국어지원관광서비스AI컨시어지실시간번역음성번역
오픈AI, 실시간 음성 작업용 오디오 모델 3종 API에 도입AI타임스
2026. 5. 8. 오후 2:57

오픈AI, 실시간 음성 작업용 오디오 모델 3종 API에 도입

음성AI실시간API음성번역음성전사추론능력개발자플랫폼멀티모달AI안전장치
아이나비모빌리티, AI 택시 호출 'M 트립 택시' 확대newsis.com
2026. 5. 8. 오후 1:55

아이나비모빌리티, AI 택시 호출 'M 트립 택시' 확대

AI택시호출다국어지원음성인식관광객서비스실시간번역모빌리티플랫폼AI컨시어지키오스크
"말만 하면 택시 호출" 아이나비모빌리티, 외국인 전용 AI 택시 플랫폼 본격화디지털데일리
2026. 5. 8. 오전 9:27

"말만 하면 택시 호출" 아이나비모빌리티, 외국인 전용 AI 택시 플랫폼 본격화

AI택시플랫폼음성인식자연어처리AI컨시어지다국어지원관광객서비스실시간번역음성클로닝