article detail
“AI, 이제 노트북 안으로”…구글 ‘젬마 4 12B’ 공개
2026. 6. 4. 오후 5:46
AI 요약
구글이 텍스트는 물론 이미지·오디오·비디오 입력을 단일 구조에서 처리하면서 16GB 수준의 그래픽 메모리나 통합 메모리를 갖춘 일반 소비자용 기기에서 실행 가능하도록 설계된 오픈모델 젬마 4 12B(Gemma 4 12B)를 공개했습니다. 이 모델은 이미지와 오디오 인코더를 제거한 인코더 프리 아키텍처를 채택해 이미지는 48×48 픽셀 단위 패치로 바로 임베딩 공간에 투영하고 오디오는 16kHz 원시 신호를 텍스트 토큰과 동일한 차원으로 변환해 처리함으로써 메모리 사용량을 절반 이하로 낮추고 지연을 줄였습니다. 약 120억 개 매개변수의 디코더 전용 트랜스포머로 젬마 26B MoE에 근접한 성능을 보이면서도 25만6000 토큰의 대규모 컨텍스트 창과 멀티토큰 예측·에이전트 워크플로 등 기능을 제공하고 아파치 2.0 라이선스로 가중치를 허깅페이스와 캐글에 공개하며 젬마 스킬 저장소도 함께 공개했습니다.


![[김동현의 AI 시대와 한국의 선택] 〈2〉언어모델이 보여준 가능성과 한계](https://img.etnews.com/news/article/2026/05/07/news-p.v1.20260507.ee75bd5a424a4adfb9d6789ff7fbb211_P3.png)

