IT뉴스모아news terminal

article detail

30억 작은 AI가 720억 거대 모델을 눌렀다, 비결은 옆에 앉힌 '잔소리꾼' 한 명이었다

전자신문AI검증검증기법다중에이전트매개변수성능개선의사결정추론최적화합성데이터

2026. 5. 18. 오전 11:09

30억 작은 AI가 720억 거대 모델을 눌렀다, 비결은 옆에 앉힌 '잔소리꾼' 한 명이었다

AI 요약

다름슈타트 공과대학교(TU Darmstadt)와 헤시안 AI(hessian.AI) 연구팀이 2026년 5월 공개한 논문 '두 번 생각하고, 한 번 행동하라(Think Twice, Act Once)'는 베가스(VeGAS) 기법을 제시해 30억 매개변수짜리 검증 AI가 720억 매개변수짜리 모델의 성능을 끌어올렸다고 보고했습니다. VeGAS는 AI가 매번 16개의 후보 행동을 생성하고 검증 AI가 각 행동을 5번씩 평가해 최고 점수 행동을 실행하도록 하며, 이로 인해 LangR 성공률이 65%에서 71%로, EB-ALFRED는 44%에서 49%로, 가장 어려운 다중 객체 조작 과제에서는 상대적 개선폭이 36%에 달했습니다. 연구진은 오픈AI의 o3 모델로 합성 실패 데이터를 만들어 검증기를 '검증 전용 훈련'으로 학습시킨 것이 핵심이며, 후보 검증을 추가해도 응답 시간은 3초에서 8초로 약 2.7배만 늘었다고 설명했습니다.

AI에게 '질문하는 법' 가르쳤다…MIT, '배틀십' 게임으로 GPT-5도 뛰어넘은 저비용 AI 개발

인공지능신문

2026. 6. 4. 오후 7:18

AI에게 '질문하는 법' 가르쳤다…MIT, '배틀십' 게임으로 GPT-5도 뛰어넘은 저비용 AI 개발

AI모델질문생성소형모델추론최적화데이터셋비용효율성능개선과학연구

데이터이쿠, 한국 CEO 95% “AI 성과 책임이 내 자리를 위협한다”

2026. 5. 28. 오후 2:11

데이터이쿠, 한국 CEO 95% “AI 성과 책임이 내 자리를 위협한다”

AI도입CEO책임직무위협의사결정AI신뢰AI에이전트AI검증AI전략

늘 하던 일인데 숨이 턱…AI 과부하에 ‘현타’ 온 직장인들 [팩플]

2026. 5. 28. 오전 5:00

늘 하던 일인데 숨이 턱…AI 과부하에 ‘현타’ 온 직장인들 [팩플]

AI과부하업무피로AX전환생산성압박직원실수의사결정퇴사비용AI검증

펀진, 제72보병사단과 AI 활용 예비전력 운영 효율화 모색

2026. 5. 14. 오후 1:51

펀진, 제72보병사단과 AI 활용 예비전력 운영 효율화 모색

AI국방예비전력군수물류의사결정지휘결심합성데이터효율화

SAS, MS와 파트너십 강화…산업용 AI 에이전트 라인업 확대

2026. 4. 29. 오전 9:00

SAS, MS와 파트너십 강화…산업용 AI 에이전트 라인업 확대

AI에이전트파트너십클라우드합성데이터디지털트윈노코드의사결정공급망

SAS 이노베이트 2026 개막…'데이터·AI 미래' 제시한다

2026. 4. 28. 오전 11:02

SAS 이노베이트 2026 개막…'데이터·AI 미래' 제시한다

데이터분석AI의사결정디지털트윈합성데이터양자컴퓨팅신뢰AI컨퍼런스

"세계 3대 AI 학회서 3편 동시 채택"…UNIST, 강화학습 경쟁력 입증

2026. 4. 21. 오전 8:01

"세계 3대 AI 학회서 3편 동시 채택"…UNIST, 강화학습 경쟁력 입증

강화학습AI학회신경망머신러닝오프라인학습다중에이전트의사결정논문채택

"AI, 기업혁신 이끄는 주체 … 일하는 방식 완전히 바뀔 것"

2026. 4. 6. 오후 4:09

"AI, 기업혁신 이끄는 주체 … 일하는 방식 완전히 바뀔 것"

AI혁신생성형AI의사결정데이터거버넌스AI검증기업운영멀티에이전트장애저감

전북대병원, 의료 AI 세미나 성료…미래 의료 혁신 방향 제시 - 보도자료 | 기사

2026. 6. 8. 오후 2:15

전북대병원, 의료 AI 세미나 성료…미래 의료 혁신 방향 제시 - 보도자료 | 기사

의료AI임상의학헬스케어바이오기술환자맞춤의사결정산학협력미래의료

에이전트AI "AI 검증 플랫폼 로보게이트…엔비디아 '인셉션' 공식 선정"

2026. 6. 8. 오후 1:17

에이전트AI "AI 검증 플랫폼 로보게이트…엔비디아 '인셉션' 공식 선정"

AI검증로봇안전휴머노이드플랫폼스타트업시뮬레이션엔비디아안전성능

“AI가 동료 된다”…SK AX, 머서와 HR 혁신 추진

2026. 6. 8. 오후 1:27

“AI가 동료 된다”…SK AX, 머서와 HR 혁신 추진

AI협업HR혁신조직운영인사체계AI리터러시에이전틱AI채용육성의사결정

에이전트AI, AI 로봇 안전검증 플랫폼 '로보게이트'로 엔비디아 인셉션 선정

2026. 6. 8. 오후 1:00

에이전트AI, AI 로봇 안전검증 플랫폼 '로보게이트'로 엔비디아 인셉션 선정

로봇안전AI검증휴머노이드안전시나리오플랫폼스타트업엔비디아