article detail
씽킹머신즈랩, 말하는 도중 끼어드는 AI 공개… GPT 리얼타임보다 3배 빠른 응답
2026. 5. 14. 오전 7:54

AI 요약
오픈AI 전 CTO 미라 무라티가 이끄는 씽킹머신즈랩이 5월 11일 음성·영상·텍스트를 실시간으로 동시에 처리하는 인터랙션 모델을 공개했으며, 200밀리초 단위의 마이크로턴 설계로 입력과 출력을 동시에 처리해 턴제 방식을 대체한다고 밝혔습니다. 공개된 TML-Interaction-Small은 2760억 파라미터 규모의 MoE 구조에 활성 파라미터 120억 개로 구성되며, FD-bench v1.5에서 77.8점을 기록해 GPT 리얼타임 2.0(xhigh) 47.8점·제미나이 3.1 플래시 라이브 45.5점을 크게 앞섰고, 턴 전환 응답 속도 0.40초(=GPT 리얼타임 2.0 최소 사양 1.18초)와 TimeSpeak 64.7%·CueSpeak 81.7%·RepCount-A 35.4% 등에서 비교 대상보다 우수한 성능을 보였습니다. 모델은 실시간 대화를 담당하는 인터랙션 모델과 복잡한 작업을 처리하는 백그라운드 모델로 구성되며, 씽킹머신즈랩은 2025년 2월 무라티가 오픈AI를 떠난 뒤 창업해 2025년 7월 안드레센 호로위츠 주도 등으로 20억 달러 시드 라운드를 마감해 기업 가치 120억 달러를 기록했고, 첫 제품 팅커를 2025년 10월 출시했으며 연내 더 큰 규모의 모델을 출시할 계획이라고 밝혔습���다.






