IT뉴스모아news terminal

article detail

30억 작은 AI가 720억 거대 모델을 눌렀다, 비결은 옆에 앉힌 '잔소리꾼' 한 명이었다

전자신문AI검증검증기법다중에이전트매개변수성능개선의사결정추론최적화합성데이터
2026. 5. 18. 오전 11:09
30억 작은 AI가 720억 거대 모델을 눌렀다, 비결은 옆에 앉힌 '잔소리꾼' 한 명이었다

AI 요약

다름슈타트 공과대학교(TU Darmstadt)와 헤시안 AI(hessian.AI) 연구팀이 2026년 5월 공개한 논문 '두 번 생각하고, 한 번 행동하라(Think Twice, Act Once)'는 베가스(VeGAS) 기법을 제시해 30억 매개변수짜리 검증 AI가 720억 매개변수짜리 모델의 성능을 끌어올렸다고 보고했습니다. VeGAS는 AI가 매번 16개의 후보 행동을 생성하고 검증 AI가 각 행동을 5번씩 평가해 최고 점수 행동을 실행하도록 하며, 이로 인해 LangR 성공률이 65%에서 71%로, EB-ALFRED는 44%에서 49%로, 가장 어려운 다중 객체 조작 과제에서는 상대적 개선폭이 36%에 달했습니다. 연구진은 오픈AI의 o3 모델로 합성 실패 데이터를 만들어 검증기를 '검증 전용 훈련'으로 학습시킨 것이 핵심이며, 후보 검증을 추가해도 응답 시간은 3초에서 8초로 약 2.7배만 늘었다고 설명했습니다.

원문보기
feed://articles/related관련 기사
펀진, 제72보병사단과 AI 활용 예비전력 운영 효율화 모색전자신문
2026. 5. 14. 오후 1:51

펀진, 제72보병사단과 AI 활용 예비전력 운영 효율화 모색

AI국방예비전력군수물류의사결정지휘결심합성데이터효율화
SAS, MS와 파트너십 강화…산업용 AI 에이전트 라인업 확대전자신문
2026. 4. 29. 오전 9:00

SAS, MS와 파트너십 강화…산업용 AI 에이전트 라인업 확대

AI에이전트파트너십클라우드합성데이터디지털트윈노코드의사결정공급망
SAS 이노베이트 2026 개막…'데이터·AI 미래' 제시한다전자신문
2026. 4. 28. 오전 11:02

SAS 이노베이트 2026 개막…'데이터·AI 미래' 제시한다

데이터분석AI의사결정디지털트윈합성데이터양자컴퓨팅신뢰AI컨퍼런스
"세계 3대 AI 학회서 3편 동시 채택"…UNIST, 강화학습 경쟁력 입증v.daum.net
2026. 4. 21. 오전 8:01

"세계 3대 AI 학회서 3편 동시 채택"…UNIST, 강화학습 경쟁력 입증

강화학습AI학회신경망머신러닝오프라인학습다중에이전트의사결정논문채택
"AI, 기업혁신 이끄는 주체 … 일하는 방식 완전히 바뀔 것"v.daum.net
2026. 4. 6. 오후 4:09

"AI, 기업혁신 이끄는 주체 … 일하는 방식 완전히 바뀔 것"

AI혁신생성형AI의사결정데이터거버넌스AI검증기업운영멀티에이전트장애저감
비드래프트, GPU 재학습 없는 LLM 프레임워크 ‘Darwin Family’ 기술 공개서울신문
2026. 5. 19. 오후 4:53

비드래프트, GPU 재학습 없는 LLM 프레임워크 ‘Darwin Family’ 기술 공개

LLM모델병합추론최적화GPU효율화파인튜닝양자화프레임워크특허기술
서일대, AI 기반 진로설계 지원… ‘재맞고 잡케어’ 운영 성료한국대학신문
2026. 5. 19. 오후 4:47

서일대, AI 기반 진로설계 지원… ‘재맞고 잡케어’ 운영 성료

AI진로설계직무분석경력개발데이터기반실습교육자기주도의사결정
비드래프트, GPU 재학습 없는 LLM 프레임워크 'Darwin Family' 기술 공개네이트
2026. 5. 19. 오후 4:56

비드래프트, GPU 재학습 없는 LLM 프레임워크 'Darwin Family' 기술 공개

LLM모델병합추론최적화GPU효율화언어모델특허기술양자화프레임워크
"AI로봇으로 바다 지킨다"…해경·중기부, 해양오염 대응체계 강화뉴스토마토
2026. 5. 19. 오후 3:13

"AI로봇으로 바다 지킨다"…해경·중기부, 해양오염 대응체계 강화

AI로봇해양오염드론군집형로봇유회수환경감시방제기술의사결정
네이버 D2SF, '판단 예측 AI' 클론랩스에 신규 투자전자신문
2026. 5. 19. 오후 2:02

네이버 D2SF, '판단 예측 AI' 클론랩스에 신규 투자

AI에이전트판단예측의사결정자동화스타트업투자유저모델신뢰도
네이버, 사용자 판단 예측하는 AI 스타트업 '클론랩스'에 신규 투자연합인포맥스
2026. 5. 19. 오전 10:34

네이버, 사용자 판단 예측하는 AI 스타트업 '클론랩스'에 신규 투자

AI에이전트유저모델의사결정벤처투자머신러닝자동화예측모델스타트업
“AI가 만든 가짜 자료 걸러낸다” 무하유 카피킬러 ‘참고문헌 유효성 검증’ 도입디지털데일리
2026. 5. 19. 오전 10:31

“AI가 만든 가짜 자료 걸러낸다” 무하유 카피킬러 ‘참고문헌 유효성 검증’ 도입

표절검사AI검증참고문헌학술데이터출처검증연구윤리데이터신뢰가짜자료