article detail
오픈AI, 웹소켓 도입으로 '코덱스' 성능 40% 개선…"속도 병목 해소"
2026. 4. 23. 오후 5:35

AI 요약
오픈AI가 웹소켓 기반으로 API 구조를 재설계해 코덱스 에이전트의 작업 처리 속도를 크게 개선했으며, 첫 응답까지 걸리는 시간(TTFT)은 약 45% 줄고 전체 에이전트 작업 속도는 최대 40% 향상됐다고 밝혔습니다. 기존에는 GPU 추론이 병목이었으나 모델 성능 향상으로 API 처리와 네트워크 지연, 특히 매 요청마다 전체 대화 맥락을 재계산하는 요청 구조가 근본적 병목으로 드러났고, 지속 연결 도입으로 캐싱·토큰 재사용·병렬 처리 등 최적화가 가능해졌습니다. 최신 코딩 모델 'GPT-5.3 코덱스 스파크'는 초당 1000토큰 처리 목표를 달성하고 실제로는 최대 4000토큰까지 도달했으며, 버셀·클라인·커서는 각각 지연 시간 최대 40%, 다중 파일 처리 속도 39%, 모델 사용 시 최대 30% 속도 개선을 보고했습니다.









