article detail
"클라우드 밖으로 나온 AI"…구글, 온디바이스 오픈모델 '젬마 4 12B' 전격 공개
2026. 6. 4. 오후 5:27
AI 요약
구글이 3일(현지시간) 노트북 등 개인용 스마트 기기에서 온디바이스로 구동할 수 있는 경량 멀티모달 AI 모델 젬마 4 12B를 공개했습니다. 이 모델은 비전·오디오용 무거운 인코더를 제거한 인코더 프리 아키텍처로 이미지와 원시 오디오를 직접 LLM 백본에 투영해 메모리 사용량을 크게 줄이고 중형급 최초로 네이티브 오디오 입력을 탑재해 표준 벤치마크에서 26B급 성능에 육박하면서도 16GB VRAM 또는 통합 메모리를 갖춘 소비자용 노트북에서 로컬 구동이 가능하며 멀티 토큰 예측(MTP) 드래프터로 추론 속도를 개선했습니다. 젬마 시리즈는 누적 다운로드 1억 5,000만 건을 기록했으며 젬마 4 12B는 아파치 2.0 라이선스 하에 공개되어 허깅페이스·캐글을 통한 체크포인트와 LM 스튜디오, 올라마, 구글 AI 엣지 갤러리 등 다양한 온디바이스 실행 환경 및 개발자 가이드를 통해 즉시 테스트·개발이 가능합니다.




![노타, GPU·NPU 동시 활용 AI 추론 기술 구현에 13%↑[특징주]](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/06/PS26060400382.jpg)

