IT뉴스모아news terminal

article detail

"클라우드 밖으로 나온 AI"…구글, 온디바이스 오픈모델 '젬마 4 12B' 전격 공개

인공지능신문경량모델로컬구동멀티모달엣지AI오디오입력오픈모델온디바이스AI추론최적화

2026. 6. 4. 오후 5:27

"클라우드 밖으로 나온 AI"…구글, 온디바이스 오픈모델 '젬마 4 12B' 전격 공개

AI 요약

구글이 3일(현지시간) 노트북 등 개인용 스마트 기기에서 온디바이스로 구동할 수 있는 경량 멀티모달 AI 모델 젬마 4 12B를 공개했습니다. 이 모델은 비전·오디오용 무거운 인코더를 제거한 인코더 프리 아키텍처로 이미지와 원시 오디오를 직접 LLM 백본에 투영해 메모리 사용량을 크게 줄이고 중형급 최초로 네이티브 오디오 입력을 탑재해 표준 벤치마크에서 26B급 성능에 육박하면서도 16GB VRAM 또는 통합 메모리를 갖춘 소비자용 노트북에서 로컬 구동이 가능하며 멀티 토큰 예측(MTP) 드래프터로 추론 속도를 개선했습니다. 젬마 시리즈는 누적 다운로드 1억 5,000만 건을 기록했으며 젬마 4 12B는 아파치 2.0 라이선스 하에 공개되어 허깅페이스·캐글을 통한 체크포인트와 LM 스튜디오, 올라마, 구글 AI 엣지 갤러리 등 다양한 온디바이스 실행 환경 및 개발자 가이드를 통해 즉시 테스트·개발이 가능합니다.

“AI, 이제 노트북 안으로”…구글 ‘젬마 4 12B’ 공개

2026. 6. 4. 오후 5:46

“AI, 이제 노트북 안으로”…구글 ‘젬마 4 12B’ 공개

오픈모델멀티모달경량화엣지AI트랜스포머컨텍스트토큰예측에이전트

리퀴드 AI, 온디바이스용 모델 ‘LFM2.5-8B-A1B’ 공개…환각 줄고 추론 대폭 강화

2026. 5. 30. 오후 12:55

리퀴드 AI, 온디바이스용 모델 ‘LFM2.5-8B-A1B’ 공개…환각 줄고 추론 대폭 강화

온디바이스AI경량모델MoE환각억제추론최적화도구호출에이전트오픈소스

‘피지컬 AI 시장 조준’ 노타, 온디바이스 최적화 기술로 로보틱스 영역 확장 가속화한다

2026. 5. 29. 오후 1:03

‘피지컬 AI 시장 조준’ 노타, 온디바이스 최적화 기술로 로보틱스 영역 확장 가속화한다

온디바이스AIVLA모델로보틱스엣지AI모델최적화추론최적화NPU피지컬AI

노타 “퀄컴 최신 엣지 AI 디바이스서 피지컬 AI 모델 최적화 성공”

2026. 5. 29. 오전 9:00

노타 “퀄컴 최신 엣지 AI 디바이스서 피지컬 AI 모델 최적화 성공”

피지컬AI엣지AIVLA모델온디바이스AI로봇NPU최적화임베디드추론최적화

노타, 글로벌 엣지 AI 어워드 ‘올해의 엣지 AI·비전 제품상’ 수상…온디바이스 AI 글로벌 기술력 입증

인공지능신문

2026. 5. 12. 오후 7:24

노타, 글로벌 엣지 AI 어워드 ‘올해의 엣지 AI·비전 제품상’ 수상…온디바이스 AI 글로벌 기술력 입증

엣지AI온디바이스AI영상관제비전언어모델AI경량화생성형AI멀티모달실시간분석

3B만 깨워도 35B처럼 생각한다 [정원훈의 AI 트렌드]

2026. 4. 24. 오전 8:00

3B만 깨워도 35B처럼 생각한다 [정원훈의 AI 트렌드]

경량모델MoE구조에이전트컨텍스트오픈소스멀티모달코딩능력추론최적화

페르소나AI, 피지컬 AI 휴머노이드 로봇 OS 공개

2026. 4. 22. 오후 3:30

페르소나AI, 피지컬 AI 휴머노이드 로봇 OS 공개

휴머노이드로봇로봇OS온디바이스AI음성인식에이전트물리AI경량모델멀티모달

클로드의 8% 가격으로 코딩한다고? [정원훈의 AI 트렌드]

2026. 4. 17. 오전 6:00

클로드의 8% 가격으로 코딩한다고? [정원훈의 AI 트렌드]

경량모델MoE구조코딩성능API가격로봇비전에이전트추론최적화멀티모달

구글, 오픈 모델 ‘젬마 4’ 공개…모바일·IoT까지 확장된 AI 생태계

2026. 4. 3. 오전 10:31

구글, 오픈 모델 ‘젬마 4’ 공개…모바일·IoT까지 확장된 AI 생태계

오픈모델엣지AI멀티모달오프라인추론AI생태계

구글, '젬마 4 QAT' 공개…“1GB 메모리로 AI 구동” 온디바이스 AI 대중화 가속

인공지능신문

2026. 6. 6. 오후 6:16

구글, '젬마 4 QAT' 공개…“1GB 메모리로 AI 구동” 온디바이스 AI 대중화 가속

온디바이스AI양자화모델압축오픈모델메모리최적화엣지컴퓨팅프라이버시로컬AI

인티그리트 “휴머노이드 로봇과 피지컬AI 시대의 경쟁력, AI 런타임 플랫폼” 상용화

2026. 6. 5. 오전 11:16

인티그리트 “휴머노이드 로봇과 피지컬AI 시대의 경쟁력, AI 런타임 플랫폼” 상용화

휴머노이드로봇피지컬AIAI런타임엣지AI데이터주권온디바이스AIG특화망AI최적화

중앙대학교, 생성AI 선도인재양성 사업 3건 동시 선정 쾌거

2026. 6. 5. 오전 11:01

중앙대학교, 생성AI 선도인재양성 사업 3건 동시 선정 쾌거

생성AI인재양성산학협력멀티모달LLMAI에이전트경량모델임베딩