IT뉴스모아news terminal

article detail

누스 리서치, ‘토큰 중첩 학습’으로 사전훈련 시간 2.5배 단축

AI타임스LLM드롭인방식모델최적화벤치마크사전훈련연산량토큰중첩학습학습효율
2026. 5. 17. 오후 6:20
누스 리서치, ‘토큰 중첩 학습’으로 사전훈련 시간 2.5배 단축

AI 요약

미국 AI 연구조직 누스 리서치는 모델 구조를 바꾸지 않고 사전학습 시간을 단축하는 '토큰 중첩 학습(TST)'을 공개했으며, 이 기법은 여러 토큰을 묶어 초기에는 압축해 학습한 뒤 복구 단계에서 개별 토큰을 예측하는 2단계로 동작하고 모델 아키텍처·옵티마이저·토크나이저 등을 변경하지 않는 드롭인 방식이며 동일한 연산량(FLOPs)을 유지한다고 설명했습니다. 연구진은 270M·600M·3B·10B-A1B MoE 등 다양한 규모에서 검증했고, 10B-A1B 실험에서는 기존 대비 약 2.5배 빠른 사전학습 속도를 기록했으며 표준 방식이 1만2311 B200 GPU-시간이 필요했던 반면 TST는 4768 GPU-시간만으로 더 낮은 최종 손실(2.236 대 2.252)과 HellaSwag·ARC·MMLU 등 벤치마크에서의 우수한 성능을 보였다고 발표했습니다. 다만 동일 데이터 소비량(equal-data) 기준에서는 기존 방식이 더 높은 성능을 기록했으며 연구진은 이를 TST 적용 범위를 결정하는 중요한 경계 조건으로 제시했으며 업계에서는 TST가 LLM 개발 비용 구조를 바꿀 가능성이 있다고 평가했습니다.

원문보기
feed://articles/related관련 기사
네이버클라우드, 엔비디아와 동맹…글로벌 AI 팩토리 사업 협력서울경제TV
2026. 6. 2. 오전 9:59

네이버클라우드, 엔비디아와 동맹…글로벌 AI 팩토리 사업 협력

AI팩토리LLM클라우드협력인프라모델최적화생태계파트너십
친사회성 역대 최고… 앤트로픽, ‘클로드 오푸스 4.8’ 출시디지털 인사이트 DIGITAL iNSIGHT
2026. 5. 29. 오후 2:11

친사회성 역대 최고… 앤트로픽, ‘클로드 오푸스 4.8’ 출시

LLM생성형AI클로드할루시네이션에이전트코딩벤치마크
“LLM은 거짓을 거짓으로 알면서도 사실처럼 말한다”… 미세조정 실험으로 드러난 ‘자신감 편향’AI 매터스
2026. 5. 29. 오전 10:24

“LLM은 거짓을 거짓으로 알면서도 사실처럼 말한다”… 미세조정 실험으로 드러난 ‘자신감 편향’

LLM자신감편향미세조정사실성거짓정보프롬프트벤치마크안전성
“박사급이라면서 왜 이렇게 답답하죠?”···AI 성능 측정, 이젠 ‘일머리’도 따진다 [경제밥도둑]v.daum.net
2026. 5. 27. 오전 7:01

“박사급이라면서 왜 이렇게 답답하죠?”···AI 성능 측정, 이젠 ‘일머리’도 따진다 [경제밥도둑]

AI성능측정벤치마크에이전트코딩능력추론능력실전평가성능괴리LLM
DMind AI, Web3 특화 LLM 벤치마크 연구 공개네이트
2026. 5. 26. 오후 3:48

DMind AI, Web3 특화 LLM 벤치마크 연구 공개

LLM벤치마크Web3블록체인스마트컨트랙트DeFi오픈소스금융
국민성장펀드 AI 투자 확대…최적화·인프라 기업 수혜 '관심'뉴시스
2026. 5. 25. 오전 9:00

국민성장펀드 AI 투자 확대…최적화·인프라 기업 수혜 '관심'

AI투자반도체데이터센터파운데이션모델모델최적화NPULLM생태계
KT·서울대 "법률 AI, 그럴듯한 답 내놔도 핵심 법리 빠뜨린다"네이트
2026. 5. 11. 오후 5:03

KT·서울대 "법률 AI, 그럴듯한 답 내놔도 핵심 법리 빠뜨린다"

법률AILLM판례분석환각누락법령오적용편향벤치마크
MS, 100여개 AI 에이전트 기반 보안AI 공개…“미토스보다 뛰어나”전자신문
2026. 5. 14. 오후 4:59

MS, 100여개 AI 에이전트 기반 보안AI 공개…“미토스보다 뛰어나”

AI에이전트보안AI취약점탐지LLM사이버보안소프트웨어보안원격코드실행벤치마크
셀렉트스타, 클로드·챗GPT 취약점 찾아내는 AI 레드티밍 기술력 '인정'v.daum.net
2026. 5. 14. 오후 3:20

셀렉트스타, 클로드·챗GPT 취약점 찾아내는 AI 레드티밍 기술력 '인정'

LLM레드티밍취약점탐지자연어처리AI안전언어모델공격성공률벤치마크
인공지능의 모든 것 한눈에 ‘제9회 국제인공지능대전’ 개최… AI 기술과 산업의 현재와 미래를 그리다뉴스와이어
2026. 5. 4. 오후 5:09

인공지능의 모든 것 한눈에 ‘제9회 국제인공지능대전’ 개최… AI 기술과 산업의 현재와 미래를 그리다

인공지능AI에이전트멀티모달LLM피지컬AIAI인프라데이터보안모델최적화
웨어큐브-비드래프트 공동 개발한 자체 LLM으로 K-AI 리더보드 3위 달성네이트
2026. 4. 30. 오전 11:04

웨어큐브-비드래프트 공동 개발한 자체 LLM으로 K-AI 리더보드 3위 달성

LLM한국어AI리더보드벤치마크AI모델디스플레이협업개발
웨어큐브, 비드래프트와 공동 개발한 자체 LLM으로 K-AI 리더보드 3위 달성네이트
2026. 4. 29. 오후 3:32

웨어큐브, 비드래프트와 공동 개발한 자체 LLM으로 K-AI 리더보드 3위 달성

LLM한국어AI리더보드벤치마크AI전환제조업언어모델협업