IT뉴스모아news terminal

article detail

프리즘ML, 1비트 LLM '본자이' 발표…극단적 압축에도 모델 정확도 유지

디일렉LLM경량모델네이티브모델압축양자화오픈소스추론성능
2026. 4. 7. 오전 12:37
프리즘ML, 1비트 LLM '본자이' 발표…극단적 압축에도 모델 정확도 유지

AI 요약

캘리포니아공과대학(칼텍) 출신들이 창업한 스타트업 프리즘ML은 지난달 말 네이티브 1비트 LLM인 본자이(Bonsai) 8B와 더 작은 4B, 1.7B 모델을 공개했으며, 본자이 8B는 메모리 1.15GB로 구동된다고 소개했습니다. 본자이는 모든 가중치를 ±1로만 표현하고 128개 가중치마다 하나의 FP16 스케일 팩터를 공유해 실질적 저장 용량을 가중치당 1.125비트로 줄였으며, 이는 사후 양자화가 아닌 처음부터 1비트로 학습한 네이티브 아키텍처라고 설명했습니다. 프리즘ML에 따르면 본자이 8B는 아이폰 17 프로 맥스에서 초당 44토큰, M4 프로 탑재 맥에서 초당 131토큰, RTX 4090에서 초당 300~400토큰을 처리하고 지능 밀도는 1.06/GB로 알리바바 Qwen3 8B의 0.10/GB보다 높으며 아파치 2.0 오픈웨이트로 배포되었으나 커뮤니티 검증은 아직 미미합니다.

원문보기
feed://articles/related관련 기사
개방·경량 AI 경쟁 본격화…구글 젬마4 확산v.daum.net
2026. 4. 7. 오전 6:15

개방·경량 AI 경쟁 본격화…구글 젬마4 확산

개방형AI경량모델오픈소스생태계에이전트온디바이스LLM
사이냅소프트, 구글 AI 기술 ‘터보퀀트’ 발 빠르게 적용… ‘사이냅 OCR IX’ 메모리 효율 극대화인공지능신문
2026. 4. 15. 오전 11:39

사이냅소프트, 구글 AI 기술 ‘터보퀀트’ 발 빠르게 적용… ‘사이냅 OCR IX’ 메모리 효율 극대화

문서AIOCR양자화벡터압축메모리최적화추론성능GPU활용비용절감
[지방의 눈으로 AI 읽기] 국가 예산 추적업v.daum.net
2026. 4. 14. 오전 7:30

[지방의 눈으로 AI 읽기] 국가 예산 추적업

AILLM로컬학습지식그래프예산분석자동화오픈소스GPU
[유철균의 ‘지방의 눈으로 AI읽기’] 국가 예산 추적업영남일보
2026. 4. 14. 오전 6:00

[유철균의 ‘지방의 눈으로 AI읽기’] 국가 예산 추적업

AILLM지식그래프예산분석오픈소스GPU학습RFP인텔리전스
밤에는 코딩하는 할리우드 배우… 요보비치, AI 메모리 도구 개발v.daum.net
2026. 4. 14. 오전 12:35

밤에는 코딩하는 할리우드 배우… 요보비치, AI 메모리 도구 개발

AI메모리오픈소스기억의궁전LLM깃허브멤팰리스AI건망증
리퀴드 AI, '갤럭시 S25 울트라'에서 작동하는 450M VLM 출시AI타임스
2026. 4. 13. 오후 6:38

리퀴드 AI, '갤럭시 S25 울트라'에서 작동하는 450M VLM 출시

경량모델VLM온디바이스비전언어다국어실시간처리엣지컴퓨팅오픈소스
[써보고서] 와이파이 끊어도 AI는 살아있다…구글 'AI 엣지 갤러리'v.daum.net
2026. 4. 12. 오전 11:49

[써보고서] 와이파이 끊어도 AI는 살아있다…구글 'AI 엣지 갤러리'

엣지AI온디바이스오픈소스젬마4모바일앱오프라인프라이버시경량모델
[AI돋보기] "AI 갈아타도 맥락 유지"…'기억 연동' 기술 확산v.daum.net
2026. 4. 11. 오전 6:35

[AI돋보기] "AI 갈아타도 맥락 유지"…'기억 연동' 기술 확산

생성형AI기억이식플랫폼락인벡터DB오픈소스추론성능AI생태계메모리기능
[AI 클로즈업] 엑사원에 눈 달았다…LG AI연구원, 피지컬 AI 레이스 참전디지털데일리
2026. 4. 10. 오후 3:46

[AI 클로즈업] 엑사원에 눈 달았다…LG AI연구원, 피지컬 AI 레이스 참전

멀티모달AIVLM오픈소스LLM벤치마크휴머노이드오픈웨이트파라미터
[매경의 창] LLM 혁명의 새 슈퍼갑 '메모리'네이트
2026. 4. 9. 오후 5:04

[매경의 창] LLM 혁명의 새 슈퍼갑 '메모리'

LLM메모리GPU캐싱양자화병목반도체AI칩
카카오의 메타식 AI 사업전략… 메타식 생태계 기반은 부족IT조선
2026. 4. 9. 오전 6:00

카카오의 메타식 AI 사업전략… 메타식 생태계 기반은 부족

AI수익화광고카카오톡LLM생태계글로벌오픈소스
구글이 개인 기기에서 오프라인으로 실행되는 AI 엔진인 젬마 4(Gemma 4)를 출시했습니다.Vietnam.vn
2026. 4. 8. 오후 7:07

구글이 개인 기기에서 오프라인으로 실행되는 AI 엔진인 젬마 4(Gemma 4)를 출시했습니다.

온디바이스AI경량모델오픈소스개인정보보호오프라인실행엣지컴퓨팅생성AI모바일AI