IT뉴스모아news terminal

article detail

구글, '젬마 4 QAT' 공개…“1GB 메모리로 AI 구동” 온디바이스 AI 대중화 가속

인공지능신문로컬AI메모리최적화모델압축양자화엣지컴퓨팅오픈모델온디바이스AI프라이버시
2026. 6. 6. 오후 6:16
구글, '젬마 4 QAT' 공개…“1GB 메모리로 AI 구동” 온디바이스 AI 대중화 가속

AI 요약

구글이 자사의 오픈 모델 '젬마 4' 제품군에 양자화 인식 학습(QAT)을 적용한 '젬마 4 QAT 모델'을 공개하고 메모리 사용량을 획기적으로 줄이면서도 기존 모델 수준의 성능을 유지할 수 있는 새로운 압축 기술을 적용했다고 5일(현지시간) 밝혔다. 구글은 업계 표준 Q4_0 포맷과 E2B·E4B용 모바일 전용 양자화 방식, 정적 활성화(Static Activations), 채널 단위 양자화와 일부 계층의 2비트 양자화, 임베딩·KV 캐시 최적화 등을 통해 젬마 4 E2B 모델의 메모리 사용량을 1GB 수준으로 낮추고 텍스트 전용 버전은 1GB 미만에서도 구동 가능하다고 설명했습니다. 모델 가중치는 허깅페이스를 통해 제공되며 GGUF 형식은 라마.cpp에서 사용 가능하고 vLLM용 압축 텐서와 Ollama, LM Studio, SGLang, MLX, Transformers.js 등 주요 개발 플랫폼과의 호환성을 제공해 소비자용 노트북과 스마트폰, 엣지 디바이스에서 로컬 AI 실행과 프라이버시 중심 서비스 구축을 가능하게 할 것으로 구글은 기대하고 있습니다.

원문보기
feed://articles/related관련 기사
스마트폰에서 고성능 AI 연산 가능…"메모리 사용 500분의 1로 확 줄여"v.daum.net
2026. 5. 7. 오후 1:52

스마트폰에서 고성능 AI 연산 가능…"메모리 사용 500분의 1로 확 줄여"

신경망양자화혼합정밀도모바일AI메모리최적화신호처리엣지컴퓨팅모델압축
퀄컴이 그리는 AI 미래 “단순 비서 넘어 ‘에이전트’로… 스냅드래곤 온디바이스 AI 혁신디지털데일리
2026. 5. 14. 오후 4:32

퀄컴이 그리는 AI 미래 “단순 비서 넘어 ‘에이전트’로… 스냅드래곤 온디바이스 AI 혁신

에이전트AI온디바이스AI엣지컴퓨팅스냅드래곤NPU생성형AI멀티모달프라이버시
[데스크칼럼] LLM 기술 각축전…성능 경쟁서 가성비·효율 경쟁으로IT비즈뉴스
2026. 6. 5. 오후 4:00

[데스크칼럼] LLM 기술 각축전…성능 경쟁서 가성비·효율 경쟁으로

LLM경량화효율성엣지컴퓨팅온디바이스AI가속기탄소배출실용모델
"클라우드 밖으로 나온 AI"…구글, 온디바이스 오픈모델 '젬마 4 12B' 전격 공개인공지능신문
2026. 6. 4. 오후 5:27

"클라우드 밖으로 나온 AI"…구글, 온디바이스 오픈모델 '젬마 4 12B' 전격 공개

온디바이스AI경량모델멀티모달오픈모델엣지AI로컬구동추론최적화오디오입력
[르포] "수천명 쓰면 감당 안 돼"… AI 구독료 폭등 잡는 인텔 '슈퍼클로' 현장 가보니 [컴퓨텍스 2026]디지털데일리
2026. 6. 3. 오전 6:30

[르포] "수천명 쓰면 감당 안 돼"… AI 구독료 폭등 잡는 인텔 '슈퍼클로' 현장 가보니 [컴퓨텍스 2026]

AI구독료온디바이스AI온프레미스슈퍼클로하이브리드AI토큰비용로컬AI클라우드연동
인티그리트, 외부 클라우드 없는 AI 로봇 관제 시스템 상용화v.daum.net
2026. 6. 2. 오후 2:41

인티그리트, 외부 클라우드 없는 AI 로봇 관제 시스템 상용화

온디바이스AI로봇관제클라우드보안엣지컴퓨팅실시간탐지G네트워크반도체시설안전관리
두 손이 자유로운 세상…AI 안경이 스마트폰 삼킬까 [스마트폰 끝내러 온 AI 안경①]이코노미스트
2026. 6. 1. 오전 8:00

두 손이 자유로운 세상…AI 안경이 스마트폰 삼킬까 [스마트폰 끝내러 온 AI 안경①]

AI안경음성인터페이스생성형AI스마트글라스XR기기온디바이스AI실시간번역프라이버시
폴라리스AI, 산업부 국가과제 선정…'온디바이스 AI' 플랫폼 개발뉴시스
2026. 5. 26. 오전 9:47

폴라리스AI, 산업부 국가과제 선정…'온디바이스 AI' 플랫폼 개발

온디바이스AI엣지컴퓨팅국가과제AI플랫폼피지컬AI중소기업통합환경로봇
폴라리스AI, '기계 속 AI 두뇌' 국가표준 만든다… 산업부 R&D 과제 선정파이낸셜뉴스
2026. 5. 26. 오전 10:10

폴라리스AI, '기계 속 AI 두뇌' 국가표준 만든다… 산업부 R&D 과제 선정

온디바이스AI국가표준AI플랫폼엣지컴퓨팅AI경량화NPU피지컬AI로봇
폴라리스AI, 산자부 국책과제 낙점…‘피지컬 AI’ 두뇌 표준 선점v.daum.net
2026. 5. 26. 오전 10:19

폴라리스AI, 산자부 국책과제 낙점…‘피지컬 AI’ 두뇌 표준 선점

온디바이스AI엣지컴퓨팅AI모델경량화NPU국책과제피지컬AI로봇방산
폴라리스AI, 산업부 국가과제 선정…"기계에 AI 두뇌 심는 표준 플랫폼 개발 나선다"v.daum.net
2026. 5. 26. 오전 10:06

폴라리스AI, 산업부 국가과제 선정…"기계에 AI 두뇌 심는 표준 플랫폼 개발 나선다"

온디바이스AI엣지컴퓨팅AI플랫폼모델경량화NPU기술피지컬AI중소기업표준화
폴라리스AI, 산업통상부 국가 과제 선정…피지컬 AI 시장 진출 기반 마련톱데일리
2026. 5. 26. 오전 9:51

폴라리스AI, 산업통상부 국가 과제 선정…피지컬 AI 시장 진출 기반 마련

온디바이스AI경량화기술엣지컴퓨팅피지컬AINPU지능형로봇국가과제산학협력