IT뉴스모아news terminal

article detail

구글·메타, AI가 스스로 추론 최적화하는 기술 개발..."토큰 비용 69.5% 절감"

AI타임스AI추론LLM에이전트벤치마크오픈소스자동화최적화추론제어토큰절감

2026. 5. 29. 오후 5:27

구글·메타, AI가 스스로 추론 최적화하는 기술 개발..."토큰 비용 69.5% 절감"

AI 요약

구글과 메타가 공개한 오토TTS는 기존 수작업 기반 TTS와 달리 연구자가 상태, 행동, 피드백, 목표를 정의해 탐색 환경을 구축하면 탐색용 LLM 에이전트가 다양한 추론 제어 알고리즘을 반복 생성·시험·수정해 최적의 연산 배분 전략을 찾는 자동화된 프레임워크입니다. 연구진은 오프라인 리플레이 환경에서 수천 개의 추론 경로 데이터를 활용해 CMC(Confidence Momentum Controller) 등 복잡한 제어 방식을 발견했고, AIME24·AIME25·HMMT25·GPQA-다이아몬드 벤치마크 및 알리바바 큐원3 시리즈·딥시크-R1 기반 모델 실험에서 토큰 사용량을 최대 69.5%까지 줄이면서 정확도는 동일하거나 소폭 향상시켰다고 발표했습니다. 전체 전략 탐색 비용은 39.9달러, 시간은 160분이며 프레임워크와 CMC 알고리즘은 깃허브를 통해 오픈소스로 공개할 예정입니다.

세계 최대 규모 올림피아드 수학 데이터셋 ‘매스넷(MathNet)’ 오픈소스로 공개...MIT, AI 추론 능력 검증과 교육 민주화

인공지능신문

2026. 4. 25. 오전 10:22

세계 최대 규모 올림피아드 수학 데이터셋 ‘매스넷(MathNet)’ 오픈소스로 공개...MIT, AI 추론 능력 검증과 교육 민주화

오픈소스수학데이터셋AI추론올림피아드벤치마크언어모델교육기술증명기반

루닛, 엔비디아 'AI 생태계 간담회' 참석…“의료 협력 가능성 논의”

2026. 6. 8. 오후 1:51

루닛, 엔비디아 'AI 생태계 간담회' 참석…“의료 협력 가능성 논의”

의료AI파운데이션모델소버린AI엔비디아오픈소스임상추론의사결정지원벤치마크

루닛, 엔비디아 'AI 에코시스템 간담회' 참석… 의료AI 글로벌 협력 논의

파이낸스스코프

2026. 6. 8. 오후 1:06

루닛, 엔비디아 'AI 에코시스템 간담회' 참석… 의료AI 글로벌 협력 논의

의료AI파운데이션모델소버린AI암검진엔비디아오픈소스글로벌협력벤치마크

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

2026. 6. 4. 오후 12:49

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

대규모언어모델AI안전성벤치마크다국어평가문화민감성LLM평가AI보안오픈소스

문샷 AI, 오픈소스 코딩 에이전트 '키미 코드 CLI' 공개…"터미널서 병렬 작업 지원"

2026. 6. 7. 오후 12:08

문샷 AI, 오픈소스 코딩 에이전트 '키미 코드 CLI' 공개…"터미널서 병렬 작업 지원"

오픈소스코딩에이전트AI모델터미널자동화병렬처리소프트웨어개발

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증" — IT뉴스모아

news.dlwlrmaon.com

2026. 6. 3. 오후 6:03

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증" — IT뉴스모아

LLM벤치마크안전성다국어문화민감성오픈소스평가도구언어모델

오프라인 구동 가능한 기업용 AI…구글 ‘젬마4 12B’ 공개

바이라인네트워크

2026. 6. 4. 오후 5:08

오프라인 구동 가능한 기업용 AI…구글 ‘젬마4 12B’ 공개

오픈소스오프라인AI기업용AILLM멀티모달엣지컴퓨팅매개변수벤치마크

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

2026. 6. 4. 오후 12:49

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

LLM안전성벤치마크다국어문화민감성평가지표오픈소스AI안전

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증"

2026. 6. 4. 오전 10:03

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증"

대규모언어모델벤치마크안전성평가문화적민감성다국어AI안전평가지표오픈소스

사람들이 가장 떠넘기고 싶은 일, 최고의 AI도 절반밖에 못 해냈다

2026. 6. 2. 오후 12:09

사람들이 가장 떠넘기고 싶은 일, 최고의 AI도 절반밖에 못 해냈다

AI성능평가직업과제노동자대체업무보조벤치마크LLM모델경제영향자동화

엔비디아 차세대 AI칩, 애플 3년 전 칩과 비슷?

글로벌이코노믹

2026. 6. 1. 오전 8:10

엔비디아 차세대 AI칩, 애플 3년 전 칩과 비슷?

AI칩프로세서ARMSoCGPU성능비교벤치마크최적화

[서울포럼 2026] 박성현 리벨리온 대표 “AI 중심축 ‘추론’으로… 역사상 최대 반도체 시장 열린다”

2026. 5. 28. 오전 10:00

[서울포럼 2026] 박성현 리벨리온 대표 “AI 중심축 ‘추론’으로… 역사상 최대 반도체 시장 열린다”

AI추론반도체ASICNPU가격효율오픈소스생태계엔비디아