IT뉴스모아news terminal

article detail

메타, ‘토큰화’ 없애고 추론 효율 2배 높인 바이트 언어모델 'BLT' 공개

AI타임스디코딩메모리최적화바이트처리언어모델추론효율토큰화트랜스포머패치처리
2026. 5. 12. 오후 6:20
메타, ‘토큰화’ 없애고 추론 효율 2배 높인 바이트 언어모델 'BLT' 공개

AI 요약

메타와 스탠포드대학교, 워싱턴대학교 공동 연구진은 바이트 단위로 작동하는 언어모델 BLT(Byte Latent Transformer)를 제시했으며, 이 모델은 엔트로피 패칭으로 평균 약 4바이트 크기의 가변 길이 패치로 텍스트를 처리하고 로컬 인코더·글로벌 트랜스포머·로컬 디코더 구조를 갖추고 있습니다. 연구진은 패치 경계와 무관하게 여러 블록을 동시에 복원하는 병렬 디코딩을 포함한 BLT-D, 내부 가벼운 로컬 디코더를 이용해 별도 초안 모델 없이 추측 디코딩을 수행하는 BLT-S, 디퓨전 초안과 자기회귀 검증을 결합한 BLT-DV 등 세 가지 기법을 제안했습니다. 실험에서는 BLT-D-4(3B)가 기존 BLT와 유사한 성능을 유지하면서 메모리 대역폭 사용량을 절반 이하로 줄였고 BLT-D-16은 최대 87~92% 절감, BLT-S는 그리디 디코딩에서 품질 저하 없이 최대 77% 절감, BLT-DV는 최대 81% 절감 효과를 보였으며 BLT-1T(1조 토큰)로 학습한 평가에서 번역에서는 큰 효율 향상을 보였으나 코딩 벤치마크에서는 블록 크기 증가에 따라 성능 민감도가 높아졌습니다.

원문보기
feed://articles/related관련 기사
경상국립대학교 박범진 교수, ‘국제머신러닝학회(ICML)’ 논문 채택경남뉴스투데이
2026. 5. 6. 오전 11:27

경상국립대학교 박범진 교수, ‘국제머신러닝학회(ICML)’ 논문 채택

머신러닝자기지도학습테이블데이터트랜스포머토큰화표현학습ICML
애플, ICLR 2026에서 대규모 RNN 훈련 혁신 발표: AI 효율성 향상 기대브랜드경제신문
2026. 4. 29. 오후 9:43

애플, ICLR 2026에서 대규모 RNN 훈련 혁신 발표: AI 효율성 향상 기대

RNN병렬훈련언어모델트랜스포머오픈소스AI효율성대규모모델매개변수
애플, ICLR 2026에서 대규모 RNN 훈련 혁신 발표: AI 효율성 향상 기대환경감시일보
2026. 4. 29. 오후 9:43

애플, ICLR 2026에서 대규모 RNN 훈련 혁신 발표: AI 효율성 향상 기대

RNN병렬화언어모델트랜스포머오픈소스모바일기기AI효율성신경망훈련
퀀텀에이아이, 구글 터보퀀트 넘는 차세대 초압축 기술 ‘퀀텀퀀트’ 공개… “AI 메모리 장벽 돌파”AI 매터스
2026. 4. 23. 오전 11:47

퀀텀에이아이, 구글 터보퀀트 넘는 차세대 초압축 기술 ‘퀀텀퀀트’ 공개… “AI 메모리 장벽 돌파”

초압축기술양자화메모리최적화언어모델멀티모달AI솔루션정보압축벡터압축
구글 터보퀀트, ICLR 검증 촉각…"AI서비스 확대될 것"(종합)v.daum.net
2026. 4. 20. 오후 2:49

구글 터보퀀트, ICLR 검증 촉각…"AI서비스 확대될 것"(종합)

거대언어모델KV캐시압축메모리최적화AI서비스온디바이스AINPU트랜스포머반도체
10 Best Machine Learning AlgorithmsUnite.AI
2026. 4. 5. 오후 4:00

10 Best Machine Learning Algorithms

머신러닝트랜스포머주목메커니즘NLP언어모델GPT신경망시퀀스학습
한국어 AI언어모델 비용 개선 가능v.daum.net
2026. 4. 6. 오후 8:38

한국어 AI언어모델 비용 개선 가능

한국어토큰화언어모델형태소BERT비용절감처리속도자연어처리
"한국, AI 사용률 37.1%…세계에서 가장 가파른 성장세"v.daum.net
2026. 5. 12. 오후 3:41

"한국, AI 사용률 37.1%…세계에서 가장 가파른 성장세"

AI사용률생성형AI아시아디지털인프라성장률언어모델지역격차AI전략
AI로 보이스피싱 음성 분석…경찰대학, 미래치안 기술 공개newsis.com
2026. 5. 12. 오후 4:00

AI로 보이스피싱 음성 분석…경찰대학, 미래치안 기술 공개

AI음성분석보이스피싱범죄데이터치안기술수사효율언어모델미래치안데이터사이언스
한국, 생성형 AI 확산 속도 세계 1위…아시아가 새 성장 축 부상mstoday.co.kr
2026. 5. 12. 오후 2:53

한국, 생성형 AI 확산 속도 세계 1위…아시아가 새 성장 축 부상

생성형AIAI확산아시아디지털인프라AI전략언어모델글로벌격차AI사용률
[단독] 내년 국가 R&D 예산안, AI가 훑는다…모델은 업스테이지 '솔라'유니콘팩토리
2026. 5. 12. 오후 2:46

[단독] 내년 국가 R&D 예산안, AI가 훑는다…모델은 업스테이지 '솔라'

AI파운데이션모델국산모델예산심의R&D예산언어모델효율화데이터학습
솔트룩스, 28일 컨퍼런스서 온톨로지·LLM 결합 '파운드리 플랫폼’ 공개AI타임스
2026. 5. 12. 오후 2:40

솔트룩스, 28일 컨퍼런스서 온톨로지·LLM 결합 '파운드리 플랫폼’ 공개

온톨로지LLM뉴로심볼릭에이전틱AI언어모델AI플랫폼컨퍼런스추론