article detail
구글·메타, AI가 스스로 추론 최적화하는 기술 개발..."토큰 비용 69.5% 절감"
2026. 5. 29. 오후 5:27

AI 요약
구글과 메타가 공개한 오토TTS는 기존 수작업 기반 TTS와 달리 연구자가 상태, 행동, 피드백, 목표를 정의해 탐색 환경을 구축하면 탐색용 LLM 에이전트가 다양한 추론 제어 알고리즘을 반복 생성·시험·수정해 최적의 연산 배분 전략을 찾는 자동화된 프레임워크입니다. 연구진은 오프라인 리플레이 환경에서 수천 개의 추론 경로 데이터를 활용해 CMC(Confidence Momentum Controller) 등 복잡한 제어 방식을 발견했고, AIME24·AIME25·HMMT25·GPQA-다이아몬드 벤치마크 및 알리바바 큐원3 시리즈·딥시크-R1 기반 모델 실험에서 토큰 사용량을 최대 69.5%까지 줄이면서 정확도는 동일하거나 소폭 향상시켰다고 발표했습니다. 전체 전략 탐색 비용은 39.9달러, 시간은 160분이며 프레임워크와 CMC 알고리즘은 깃허브를 통해 오픈소스로 공개할 예정입니다.
![[서울포럼 2026] 박성현 리벨리온 대표 “AI 중심축 ‘추론’으로… 역사상 최대 반도체 시장 열린다”](https://wimg.sedaily.com/news/cms/2026/05/28/news-p.v1.20260528.6d499b128db04b01a9baefb6e101cbcb_R.jpg)


![[단독]말 한마디로 프로그래밍할 수 있는 AI에이전트의 시대](https://dimg.donga.com/wps/NEWS/IMAGE/2026/05/20/133961686.4.jpg)