IT뉴스모아news terminal

article detail

누스 리서치, ‘토큰 중첩 학습’으로 사전훈련 시간 2.5배 단축

AI타임스LLM드롭인방식모델최적화벤치마크사전훈련연산량토큰중첩학습학습효율

2026. 5. 17. 오후 6:20

누스 리서치, ‘토큰 중첩 학습’으로 사전훈련 시간 2.5배 단축

AI 요약

미국 AI 연구조직 누스 리서치는 모델 구조를 바꾸지 않고 사전학습 시간을 단축하는 '토큰 중첩 학습(TST)'을 공개했으며, 이 기법은 여러 토큰을 묶어 초기에는 압축해 학습한 뒤 복구 단계에서 개별 토큰을 예측하는 2단계로 동작하고 모델 아키텍처·옵티마이저·토크나이저 등을 변경하지 않는 드롭인 방식이며 동일한 연산량(FLOPs)을 유지한다고 설명했습니다. 연구진은 270M·600M·3B·10B-A1B MoE 등 다양한 규모에서 검증했고, 10B-A1B 실험에서는 기존 대비 약 2.5배 빠른 사전학습 속도를 기록했으며 표준 방식이 1만2311 B200 GPU-시간이 필요했던 반면 TST는 4768 GPU-시간만으로 더 낮은 최종 손실(2.236 대 2.252)과 HellaSwag·ARC·MMLU 등 벤치마크에서의 우수한 성능을 보였다고 발표했습니다. 다만 동일 데이터 소비량(equal-data) 기준에서는 기존 방식이 더 높은 성능을 기록했으며 연구진은 이를 TST 적용 범위를 결정하는 중요한 경계 조건으로 제시했으며 업계에서는 TST가 LLM 개발 비용 구조를 바꿀 가능성이 있다고 평가했습니다.

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개 — IT뉴스모아

news.dlwlrmaon.com

2026. 6. 3. 오후 8:49

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개 — IT뉴스모아

AI안전성벤치마크다국어LLM문화민감성평가도구

에임인텔리전스, 10개국 문화·법률 반영 AI 안전성 벤치마크 ‘XL-SafetyBench’ 공개 — IT뉴스모아

news.dlwlrmaon.com

2026. 6. 3. 오후 5:50

에임인텔리전스, 10개국 문화·법률 반영 AI 안전성 벤치마크 ‘XL-SafetyBench’ 공개 — IT뉴스모아

AI안전성벤치마크다국어LLM문화민감성리스크관리

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증" — IT뉴스모아

news.dlwlrmaon.com

2026. 6. 3. 오후 6:03

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증" — IT뉴스모아

LLM벤치마크안전성다국어문화민감성오픈소스평가도구언어모델

[테크스냅] KT, 'XL-세이프티벤치' 벤치마크 공개 — IT뉴스모아

news.dlwlrmaon.com

2026. 6. 3. 오후 6:32

[테크스냅] KT, 'XL-세이프티벤치' 벤치마크 공개 — IT뉴스모아

LLM안전성평가벤치마크다국어문화민감성AI안전

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가AI안전언어모델

네이버클라우드, 국내 기업 최초 엔비디아 AI 개발 연합체 참여

2026. 6. 5. 오전 8:52

네이버클라우드, 국내 기업 최초 엔비디아 AI 개발 연합체 참여

AI개발오픈소스생성형AILLM클라우드기술협력모델최적화

[테크스냅] AI PC서 GPU·NPU 분산 활용…노타, LLM 추론 효율 높인다

2026. 6. 4. 오전 9:10

[테크스냅] AI PC서 GPU·NPU 분산 활용…노타, LLM 추론 효율 높인다

AIPCGPUNPULLM추론에너지효율벤치마크디지털트윈

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성프롬프트평가AI안전

[AI 브리프] NC AI, 한화오션 상선·특수선에 ‘자율 용접 로봇 AI 두뇌’ 공급

아이티데일리

2026. 6. 4. 오후 4:42

[AI 브리프] NC AI, 한화오션 상선·특수선에 ‘자율 용접 로봇 AI 두뇌’ 공급

자율용접로봇AI비전인식협동로봇LLMAI에이전트산업특화벤치마크

[테크스냅] AI PC서 GPU·NPU 분산 활용…노타, LLM 추론 효율 높인다

2026. 6. 4. 오전 9:10

[테크스냅] AI PC서 GPU·NPU 분산 활용…노타, LLM 추론 효율 높인다

AIPCGPUNPULLM추론최적화이기종컴퓨팅에너지효율벤치마크

오프라인 구동 가능한 기업용 AI…구글 ‘젬마4 12B’ 공개

바이라인네트워크

2026. 6. 4. 오후 5:08

오프라인 구동 가능한 기업용 AI…구글 ‘젬마4 12B’ 공개

오픈소스오프라인AI기업용AILLM멀티모달엣지컴퓨팅매개변수벤치마크

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가언어모델AI안전