article detail
30억 작은 AI가 720억 거대 모델을 눌렀다, 비결은 옆에 앉힌 '잔소리꾼' 한 명이었다
2026. 5. 18. 오전 11:09

AI 요약
다름슈타트 공과대학교(TU Darmstadt)와 헤시안 AI(hessian.AI) 연구팀이 2026년 5월 공개한 논문 '두 번 생각하고, 한 번 행동하라(Think Twice, Act Once)'는 베가스(VeGAS) 기법을 제시해 30억 매개변수짜리 검증 AI가 720억 매개변수짜리 모델의 성능을 끌어올렸다고 보고했습니다. VeGAS는 AI가 매번 16개의 후보 행동을 생성하고 검증 AI가 각 행동을 5번씩 평가해 최고 점수 행동을 실행하도록 하며, 이로 인해 LangR 성공률이 65%에서 71%로, EB-ALFRED는 44%에서 49%로, 가장 어려운 다중 객체 조작 과제에서는 상대적 개선폭이 36%에 달했습니다. 연구진은 오픈AI의 o3 모델로 합성 실패 데이터를 만들어 검증기를 '검증 전용 훈련'으로 학습시킨 것이 핵심이며, 후보 검증을 추가해도 응답 시간은 3초에서 8초로 약 2.7배만 늘었다고 설명했습니다.







