IT뉴스모아news terminal

article detail

"클라우드 밖으로 나온 AI"…구글, 온디바이스 오픈모델 '젬마 4 12B' 전격 공개

인공지능신문경량모델로컬구동멀티모달엣지AI오디오입력오픈모델온디바이스AI추론최적화
2026. 6. 4. 오후 5:27
"클라우드 밖으로 나온 AI"…구글, 온디바이스 오픈모델 '젬마 4 12B' 전격 공개

AI 요약

구글이 3일(현지시간) 노트북 등 개인용 스마트 기기에서 온디바이스로 구동할 수 있는 경량 멀티모달 AI 모델 젬마 4 12B를 공개했습니다. 이 모델은 비전·오디오용 무거운 인코더를 제거한 인코더 프리 아키텍처로 이미지와 원시 오디오를 직접 LLM 백본에 투영해 메모리 사용량을 크게 줄이고 중형급 최초로 네이티브 오디오 입력을 탑재해 표준 벤치마크에서 26B급 성능에 육박하면서도 16GB VRAM 또는 통합 메모리를 갖춘 소비자용 노트북에서 로컬 구동이 가능하며 멀티 토큰 예측(MTP) 드래프터로 추론 속도를 개선했습니다. 젬마 시리즈는 누적 다운로드 1억 5,000만 건을 기록했으며 젬마 4 12B는 아파치 2.0 라이선스 하에 공개되어 허깅페이스·캐글을 통한 체크포인트와 LM 스튜디오, 올라마, 구글 AI 엣지 갤러리 등 다양한 온디바이스 실행 환경 및 개발자 가이드를 통해 즉시 테스트·개발이 가능합니다.

원문보기
feed://articles/related관련 기사
리퀴드 AI, 온디바이스용 모델 ‘LFM2.5-8B-A1B’ 공개…환각 줄고 추론 대폭 강화AI타임스
2026. 5. 30. 오후 12:55

리퀴드 AI, 온디바이스용 모델 ‘LFM2.5-8B-A1B’ 공개…환각 줄고 추론 대폭 강화

온디바이스AI경량모델MoE환각억제추론최적화도구호출에이전트오픈소스
‘피지컬 AI 시장 조준’ 노타, 온디바이스 최적화 기술로 로보틱스 영역 확장 가속화한다헬로티
2026. 5. 29. 오후 1:03

‘피지컬 AI 시장 조준’ 노타, 온디바이스 최적화 기술로 로보틱스 영역 확장 가속화한다

온디바이스AIVLA모델로보틱스엣지AI모델최적화추론최적화NPU피지컬AI
노타 “퀄컴 최신 엣지 AI 디바이스서 피지컬 AI 모델 최적화 성공”테크월드
2026. 5. 29. 오전 9:00

노타 “퀄컴 최신 엣지 AI 디바이스서 피지컬 AI 모델 최적화 성공”

피지컬AI엣지AIVLA모델온디바이스AI로봇NPU최적화임베디드추론최적화
노타, 글로벌 엣지 AI 어워드 ‘올해의 엣지 AI·비전 제품상’ 수상…온디바이스 AI 글로벌 기술력 입증인공지능신문
2026. 5. 12. 오후 7:24

노타, 글로벌 엣지 AI 어워드 ‘올해의 엣지 AI·비전 제품상’ 수상…온디바이스 AI 글로벌 기술력 입증

엣지AI온디바이스AI영상관제비전언어모델AI경량화생성형AI멀티모달실시간분석
3B만 깨워도 35B처럼 생각한다 [정원훈의 AI 트렌드]IT조선
2026. 4. 24. 오전 8:00

3B만 깨워도 35B처럼 생각한다 [정원훈의 AI 트렌드]

경량모델MoE구조에이전트컨텍스트오픈소스멀티모달코딩능력추론최적화
페르소나AI, 피지컬 AI 휴머노이드 로봇 OS 공개로봇신문
2026. 4. 22. 오후 3:30

페르소나AI, 피지컬 AI 휴머노이드 로봇 OS 공개

휴머노이드로봇로봇OS온디바이스AI음성인식에이전트물리AI경량모델멀티모달
클로드의 8% 가격으로 코딩한다고? [정원훈의 AI 트렌드]IT조선
2026. 4. 17. 오전 6:00

클로드의 8% 가격으로 코딩한다고? [정원훈의 AI 트렌드]

경량모델MoE구조코딩성능API가격로봇비전에이전트추론최적화멀티모달
구글, 오픈 모델 ‘젬마 4’ 공개…모바일·IoT까지 확장된 AI 생태계mstoday.co.kr
2026. 4. 3. 오전 10:31

구글, 오픈 모델 ‘젬마 4’ 공개…모바일·IoT까지 확장된 AI 생태계

오픈모델엣지AI멀티모달오프라인추론AI생태계
노타, 이기종 컴퓨팅 기반 LLM 최적화 구현…"실행효율 제고 노력"네이트
2026. 6. 4. 오전 8:53

노타, 이기종 컴퓨팅 기반 LLM 최적화 구현…"실행효율 제고 노력"

LLM이기종컴퓨팅추론최적화AIPCNPUGPU온디바이스AI에너지효율
노타, GPU·NPU 동시 활용 AI 추론 기술 구현에 13%↑[특징주]이데일리
2026. 6. 4. 오전 9:11

노타, GPU·NPU 동시 활용 AI 추론 기술 구현에 13%↑[특징주]

AI추론GPUNPULLM이기종컴퓨팅에너지효율온디바이스AI추론최적화
노타, GPU·NPU 역할 분담으로 온디바이스 AI 효율 높인다네이트
2026. 6. 4. 오후 2:12

노타, GPU·NPU 역할 분담으로 온디바이스 AI 효율 높인다

온디바이스AIGPUNPU이기종컴퓨팅LLM추론최적화분리형추론에너지효율
노타, 'AI PC' GPU·NPU 동시 활용 최적화 기술 구현전자신문
2026. 6. 4. 오전 10:22

노타, 'AI PC' GPU·NPU 동시 활용 최적화 기술 구현

AIPCGPUNPULLM추론최적화이기종컴퓨팅온디바이스AI에너지효율