IT뉴스모아news terminal

article detail

구글, '젬마 4 QAT' 공개…“1GB 메모리로 AI 구동” 온디바이스 AI 대중화 가속

인공지능신문로컬AI메모리최적화모델압축양자화엣지컴퓨팅오픈모델온디바이스AI프라이버시

2026. 6. 6. 오후 6:16

구글, '젬마 4 QAT' 공개…“1GB 메모리로 AI 구동” 온디바이스 AI 대중화 가속

AI 요약

구글이 자사의 오픈 모델 '젬마 4' 제품군에 양자화 인식 학습(QAT)을 적용한 '젬마 4 QAT 모델'을 공개하고 메모리 사용량을 획기적으로 줄이면서도 기존 모델 수준의 성능을 유지할 수 있는 새로운 압축 기술을 적용했다고 5일(현지시간) 밝혔다. 구글은 업계 표준 Q4_0 포맷과 E2B·E4B용 모바일 전용 양자화 방식, 정적 활성화(Static Activations), 채널 단위 양자화와 일부 계층의 2비트 양자화, 임베딩·KV 캐시 최적화 등을 통해 젬마 4 E2B 모델의 메모리 사용량을 1GB 수준으로 낮추고 텍스트 전용 버전은 1GB 미만에서도 구동 가능하다고 설명했습니다. 모델 가중치는 허깅페이스를 통해 제공되며 GGUF 형식은 라마.cpp에서 사용 가능하고 vLLM용 압축 텐서와 Ollama, LM Studio, SGLang, MLX, Transformers.js 등 주요 개발 플랫폼과의 호환성을 제공해 소비자용 노트북과 스마트폰, 엣지 디바이스에서 로컬 AI 실행과 프라이버시 중심 서비스 구축을 가능하게 할 것으로 구글은 기대하고 있습니다.

스마트폰에서 고성능 AI 연산 가능…"메모리 사용 500분의 1로 확 줄여"

2026. 5. 7. 오후 1:52

스마트폰에서 고성능 AI 연산 가능…"메모리 사용 500분의 1로 확 줄여"

신경망양자화혼합정밀도모바일AI메모리최적화신호처리엣지컴퓨팅모델압축

퀄컴이 그리는 AI 미래 “단순 비서 넘어 ‘에이전트’로… 스냅드래곤 온디바이스 AI 혁신

디지털데일리

2026. 5. 14. 오후 4:32

퀄컴이 그리는 AI 미래 “단순 비서 넘어 ‘에이전트’로… 스냅드래곤 온디바이스 AI 혁신

에이전트AI온디바이스AI엣지컴퓨팅스냅드래곤NPU생성형AI멀티모달프라이버시

노타, 천안시 하천·지하차도·우범지역에 온디바이스 AI 심는다

2026. 6. 8. 오전 9:53

노타, 천안시 하천·지하차도·우범지역에 온디바이스 AI 심는다

온디바이스AI도시안전VLM위험검지침수감지이상행동실증사업엣지컴퓨팅

노타, 공공 안전 인프라에 온디바이스 AI 최적화 기술 적용 확대

2026. 6. 8. 오전 9:33

노타, 공공 안전 인프라에 온디바이스 AI 최적화 기술 적용 확대

온디바이스AI공공안전도시안전망비전언어모델CCTV분석재난대응경량화엣지컴퓨팅

노타, 107억 규모 '온디바이스 AI 도시안전망' 사업 선정

파이낸스스코프

2026. 6. 8. 오전 8:35

노타, 107억 규모 '온디바이스 AI 도시안전망' 사업 선정

온디바이스AI도시안전망재난감지VLMCCTV분석엣지컴퓨팅스마트시티개인정보보호

노타, 공공 안전 인프라에 온디바이스 AI 최적화 기술 적용 확대

2026. 6. 8. 오전 9:33

노타, 공공 안전 인프라에 온디바이스 AI 최적화 기술 적용 확대

온디바이스AI모델경량화도시안전재난대응VLM엣지컴퓨팅CCTV분석공공안전

노타, ‘온디바이스 AI 도시안전망 실증 사업’ 맡아

2026. 6. 8. 오전 8:29

노타, ‘온디바이스 AI 도시안전망 실증 사업’ 맡아

온디바이스AI도시안전망실증사업비전언어모델CCTV영상재난감지AI경량화엣지컴퓨팅

노타, 온디바이스 AI 도시안전망 실증 사업 선정…"천안시 재난안전 대응 고도화"

프라임경제

2026. 6. 8. 오전 8:28

노타, 온디바이스 AI 도시안전망 실증 사업 선정…"천안시 재난안전 대응 고도화"

온디바이스AI도시안전망실증사업비전언어모델CCTV재난감지엣지컴퓨팅개인정보보호

[데스크칼럼] LLM 기술 각축전…성능 경쟁서 가성비·효율 경쟁으로

2026. 6. 5. 오후 4:00

[데스크칼럼] LLM 기술 각축전…성능 경쟁서 가성비·효율 경쟁으로

LLM경량화효율성엣지컴퓨팅온디바이스AI가속기탄소배출실용모델

"클라우드 밖으로 나온 AI"…구글, 온디바이스 오픈모델 '젬마 4 12B' 전격 공개

인공지능신문

2026. 6. 4. 오후 5:27

"클라우드 밖으로 나온 AI"…구글, 온디바이스 오픈모델 '젬마 4 12B' 전격 공개

온디바이스AI경량모델멀티모달오픈모델엣지AI로컬구동추론최적화오디오입력

[르포] "수천명 쓰면 감당 안 돼"… AI 구독료 폭등 잡는 인텔 '슈퍼클로' 현장 가보니 [컴퓨텍스 2026]

디지털데일리

2026. 6. 3. 오전 6:30

[르포] "수천명 쓰면 감당 안 돼"… AI 구독료 폭등 잡는 인텔 '슈퍼클로' 현장 가보니 [컴퓨텍스 2026]

AI구독료온디바이스AI온프레미스슈퍼클로하이브리드AI토큰비용로컬AI클라우드연동

인티그리트, 외부 클라우드 없는 AI 로봇 관제 시스템 상용화

2026. 6. 2. 오후 2:41

인티그리트, 외부 클라우드 없는 AI 로봇 관제 시스템 상용화

온디바이스AI로봇관제클라우드보안엣지컴퓨팅실시간탐지G네트워크반도체시설안전관리