IT뉴스모아news terminal

article detail

구글·메타, AI가 스스로 추론 최적화하는 기술 개발..."토큰 비용 69.5% 절감"

AI타임스AI추론LLM에이전트벤치마크오픈소스자동화최적화추론제어토큰절감
2026. 5. 29. 오후 5:27
구글·메타, AI가 스스로 추론 최적화하는 기술 개발..."토큰 비용 69.5% 절감"

AI 요약

구글과 메타가 공개한 오토TTS는 기존 수작업 기반 TTS와 달리 연구자가 상태, 행동, 피드백, 목표를 정의해 탐색 환경을 구축하면 탐색용 LLM 에이전트가 다양한 추론 제어 알고리즘을 반복 생성·시험·수정해 최적의 연산 배분 전략을 찾는 자동화된 프레임워크입니다. 연구진은 오프라인 리플레이 환경에서 수천 개의 추론 경로 데이터를 활용해 CMC(Confidence Momentum Controller) 등 복잡한 제어 방식을 발견했고, AIME24·AIME25·HMMT25·GPQA-다이아몬드 벤치마크 및 알리바바 큐원3 시리즈·딥시크-R1 기반 모델 실험에서 토큰 사용량을 최대 69.5%까지 줄이면서 정확도는 동일하거나 소폭 향상시켰다고 발표했습니다. 전체 전략 탐색 비용은 39.9달러, 시간은 160분이며 프레임워크와 CMC 알고리즘은 깃허브를 통해 오픈소스로 공개할 예정입니다.

원문보기
feed://articles/related관련 기사
세계 최대 규모 올림피아드 수학 데이터셋 ‘매스넷(MathNet)’ 오픈소스로 공개...MIT, AI 추론 능력 검증과 교육 민주화인공지능신문
2026. 4. 25. 오전 10:22

세계 최대 규모 올림피아드 수학 데이터셋 ‘매스넷(MathNet)’ 오픈소스로 공개...MIT, AI 추론 능력 검증과 교육 민주화

오픈소스수학데이터셋AI추론올림피아드벤치마크언어모델교육기술증명기반
[서울포럼 2026] 박성현 리벨리온 대표 “AI 중심축 ‘추론’으로… 역사상 최대 반도체 시장 열린다”서울경제
2026. 5. 28. 오전 10:00

[서울포럼 2026] 박성현 리벨리온 대표 “AI 중심축 ‘추론’으로… 역사상 최대 반도체 시장 열린다”

AI추론반도체ASICNPU가격효율오픈소스생태계엔비디아
AI 추론 속도 4.5배↑…뉴로클, 인텔 행사서 비전검사 기술 공개유니콘팩토리
2026. 5. 27. 오후 2:30

AI 추론 속도 4.5배↑…뉴로클, 인텔 행사서 비전검사 기술 공개

AI추론비전검사엣지AI오토딥러닝산업용AI런타임라이브러리NPU최적화
F5, “국내 기업 55%, AI 추론 워크로드 이미 운영 중”elec4
2026. 5. 27. 오전 2:48

F5, “국내 기업 55%, AI 추론 워크로드 이미 운영 중”

AI추론프로덕션워크로드클라우드데이터센터보안거버넌스자동화
Web3 특화 AI 벤치마크 ‘DMind Benchmark’, KDD 2026 공식 채택이데일리
2026. 5. 26. 오후 2:48

Web3 특화 AI 벤치마크 ‘DMind Benchmark’, KDD 2026 공식 채택

LLM평가Web3블록체인벤치마크스마트컨트랙트오픈소스AI모델보안취약점
DMind AI, Web3 특화 LLM 벤치마크 연구 공개네이트
2026. 5. 26. 오후 3:48

DMind AI, Web3 특화 LLM 벤치마크 연구 공개

LLM벤치마크Web3블록체인스마트컨트랙트DeFi오픈소스금융
KDD 2026서 웹3 AI 성능 평가 논문 채택…'디마인드 벤치마크' 공개네이트
2026. 5. 26. 오후 3:01

KDD 2026서 웹3 AI 성능 평가 논문 채택…'디마인드 벤치마크' 공개

웹3AI성능벤치마크블록체인대형언어모델스마트컨트랙트DeFi오픈소스
F5, “국내 기업 55%, AI 추론 워크로드 이미 운영 중”elec4
2026. 5. 26. 오후 2:48

F5, “국내 기업 55%, AI 추론 워크로드 이미 운영 중”

AI추론프로덕션멀티클라우드하이브리드AI거버넌스자동화보안비용최적화
F5, “한국 기업 55%, AI 추론 워크로드 운영 중”...AI, 실험 넘어 실제 운영 단계로인공지능신문
2026. 5. 26. 오전 7:59

F5, “한국 기업 55%, AI 추론 워크로드 운영 중”...AI, 실험 넘어 실제 운영 단계로

AI추론프로덕션워크로드멀티클라우드AI거버넌스보안비용최적화자동화
“AI가 찾는 취약점, 인간이 못 막는다”… 앤트로픽, ‘프로젝트 글래스윙’ 첫 성과 공개인공지능신문
2026. 5. 25. 오후 11:14

“AI가 찾는 취약점, 인간이 못 막는다”… 앤트로픽, ‘프로젝트 글래스윙’ 첫 성과 공개

AI보안취약점탐지사이버보안클로드오픈소스버그탐지패치관리자동화
그렙, 온라인 시험 감독 솔루션 '모니토'에 LLM 에이전트 적용v.daum.net
2026. 5. 21. 오후 3:36

그렙, 온라인 시험 감독 솔루션 '모니토'에 LLM 에이전트 적용

온라인시험감독솔루션LLM에이전트AI분석부정행위탐지자동화협업시스템
[단독]말 한마디로 프로그래밍할 수 있는 AI에이전트의 시대동아일보
2026. 5. 21. 오전 12:30

[단독]말 한마디로 프로그래밍할 수 있는 AI에이전트의 시대

AI에이전트음성지시오픈소스협업자동화엔터프라이즈플랫폼오케스트레이션