IT뉴스모아news terminal

article detail

엔비디아, AI 모델 하나로 여러 크기 구현하는 '스타 엘라스틱' 공개

AI타임스AI모델LLM경량화모델압축양자화지식증류추론최적화혼합전문가
2026. 5. 11. 오후 5:43
엔비디아, AI 모델 하나로 여러 크기 구현하는 '스타 엘라스틱' 공개

AI 요약

엔비디아는 9일 하나의 LLM 체크포인트에서 여러 크기의 하위 모델을 동시에 포함하는 사후 학습 기술 '스타 엘라스틱'을 공개했으며, 네모트론 나노 v3(300억개 매개변수, 실제 활성 매개변수 36억개) 기반으로 하나의 학습으로 23B(활성 28억개)와 12B(활성 20억개) 버전을 생성할 수 있도록 설계했습니다. 연구진은 중요도 추정에 따른 중첩 가중치 공유와 MoE에서의 라우터 가중 전문가 활성 프루닝(REAP), Gumbel-Softmax 기반 학습형 라우터와 지식 증류를 도입해 하위 모델 구조를 자동 선택·학습하도록 했고, 긴 추론은 작은 모델이, 최종 답변은 큰 모델이 처리하는 전략으로 최대 16% 높은 정확도와 최대 1.9배 낮은 지연시간을 기록했다고 밝혔습니다. 단일 NVFP4 양자화 체크포인트로 저장공간을 126.1GB에서 58.9GB로 줄였고 학습 토큰 사용량을 최대 360배 절감했으며, 엘라스틱-23B는 일부 벤치마크에서 큐원3-30B-A3B를 능가하고 AIME 2025에서 85.63점을 기록했다고 설명했습니다.

원문보기
feed://articles/related관련 기사
프리즘ML, 1비트 LLM '본자이' 발표…극단적 압축에도 모델 정확도 유지디일렉
2026. 4. 7. 오전 12:37

프리즘ML, 1비트 LLM '본자이' 발표…극단적 압축에도 모델 정확도 유지

LLM양자화모델압축네이티브오픈소스추론성능경량모델
K-AI 모델, 통화·번역·모빌리티 등 산업 적용 확대디지털투데이
2026. 5. 11. 오후 3:18

K-AI 모델, 통화·번역·모빌리티 등 산업 적용 확대

AI모델통화에이전트실시간번역음성인식차량AILLM생성형AI금융AI
몸값 61조 뛴 딥시크, 中 국가자산 격상…AI 반도체 수혜주는연합인포맥스
2026. 5. 10. 오전 9:33

몸값 61조 뛴 딥시크, 中 국가자산 격상…AI 반도체 수혜주는

AI모델반도체중국기업추론최적화칩메이커국가자산성능효율투자펀드
[테크스냅] 정부 데이터셋, LLM·피지컬AI용으로 재가공네이트
2026. 5. 7. 오후 12:01

[테크스냅] 정부 데이터셋, LLM·피지컬AI용으로 재가공

생성형AILLM피지컬AI데이터셋업사이클링AX디바이스NPUAI모델
미토스 쇼크에…정부 'AI 보안 주권' 확보 나선다한국경제
2026. 5. 8. 오후 5:40

미토스 쇼크에…정부 'AI 보안 주권' 확보 나선다

AI보안LLM사이버보안취약점해킹보안주권AI모델클라우드
"국내 화학 산업에 특화된 LLM 만든다"…손맞잡은 AI 스타트업네이트
2026. 5. 8. 오후 4:30

"국내 화학 산업에 특화된 LLM 만든다"…손맞잡은 AI 스타트업

LLM화학산업AI모델특허데이터신약개발소재과학도메인특화스타트업
워트인텔리전스·트릴리온랩스, 화학 특화 AI 모델 개발 맞손데이터넷
2026. 5. 8. 오전 10:15

워트인텔리전스·트릴리온랩스, 화학 특화 AI 모델 개발 맞손

AI모델화학산업LLM신약개발SaaS설명가능AI도메인특화데이터
스마트폰에서 고성능 AI 연산 가능…"메모리 사용 500분의 1로 확 줄여"v.daum.net
2026. 5. 7. 오후 1:52

스마트폰에서 고성능 AI 연산 가능…"메모리 사용 500분의 1로 확 줄여"

신경망양자화혼합정밀도모바일AI메모리최적화신호처리엣지컴퓨팅모델압축
[컨콜] 정신아 카카오 대표 "에이전트 AI 플랫폼 전환, 5000만 이용자 온보딩 목표"v.daum.net
2026. 5. 7. 오후 12:06

[컨콜] 정신아 카카오 대표 "에이전트 AI 플랫폼 전환, 5000만 이용자 온보딩 목표"

에이전트AI플랫폼LLM온보딩토크나이저추론최적화챗봇생성AI
검색부터 결제까지 카톡 안에서…카카오 AI 에이전트 나온다v.daum.net
2026. 5. 7. 오후 12:11

검색부터 결제까지 카톡 안에서…카카오 AI 에이전트 나온다

AI에이전트LLM카카오톡음성쇼핑추론최적화한국어특화결제서비스플래닝성능
카카오, 역대 1분기 최대 실적…“5000만 AI 에이전트 시대 연다”아시아타임즈
2026. 5. 7. 오전 11:11

카카오, 역대 1분기 최대 실적…“5000만 AI 에이전트 시대 연다”

실적증가AI에이전트플랫폼사업광고매출커머스LLM톡비즈추론최적화
말귀 알아듣는 ‘제조 AI’...공정 설계 일주일에서 1시간으로 줄여v.daum.net
2026. 5. 6. 오후 2:39

말귀 알아듣는 ‘제조 AI’...공정 설계 일주일에서 1시간으로 줄여

제조AILLM다중에이전트자동화로봇공정설계비전언어경량화