IT뉴스모아news terminal

article detail

스냅드래곤 8 엘리트 5세대 NPU 성능은?…'실리콘 고문' 해봤더니

전자신문LLMNPU성능갤럭시AI스냅드래곤신경망처리양자화온디바이스AI토큰속도

2026. 4. 22. 오후 5:00

스냅드래곤 8 엘리트 5세대 NPU 성능은?…'실리콘 고문' 해봤더니

AI 요약

스냅드래곤 8 엘리트 5세대(Gen 5)는 신경망처리장치(NPU) 성능이 이전 세대 대비 37~39% 향상됐으며, 네트워크를 차단한 상태에서 MLC LLM 기반 MLC Chat 앱으로 메타의 라마 3(Llama-3)-8B(70억~80억 파라미터, 4비트 양자화(INT4)) 모델을 가동해 NPU 성능을 시험했습니다. 테스트에서 프리필은 68 tok/s, 디코드는 초기 25.1 tok/s를 기록했고 소설·대본 창작 등 고난도 작업에서도 약 20 tok/s 수준을 유지하다가 장시간 사용 시 일시적으로 15 tok/s로 하락했으나 기기 발열은 느껴지지 않았고 앱 재기동 시 즉시 25 tok/s로 복귀해 이는 NPU 성능보다는 LLM 모델의 최적화 이슈로 추정된다고 보도했습니다. 디코드 20 tok/s 이상은 사람 평균 읽기 속도보다 3~4배 빠른 수준이며 앞선 세대 AP들이 최고 14~15 tok/s였던 것과 비교해 성능 향상이 뚜렷하고, 이러한 디바이스 내 AI 연산 능력은 콘텐츠 제작과 개인 맞춤형 추천 등 갤럭시 AI의 File Overview, Nightography 비디오, Photo Assist, Now Nudge 등 기능에서 활용 폭을 넓혀 갤럭시 S26 울트라 등에서 콘텐츠 제작에 기여한다고 전했습니다.

구글, '젬마 4 QAT' 공개…“1GB 메모리로 AI 구동” 온디바이스 AI 대중화 가속

인공지능신문

2026. 6. 6. 오후 6:16

구글, '젬마 4 QAT' 공개…“1GB 메모리로 AI 구동” 온디바이스 AI 대중화 가속

온디바이스AI양자화모델압축오픈모델메모리최적화엣지컴퓨팅프라이버시로컬AI

[데스크칼럼] LLM 기술 각축전…성능 경쟁서 가성비·효율 경쟁으로

2026. 6. 5. 오후 4:00

[데스크칼럼] LLM 기술 각축전…성능 경쟁서 가성비·효율 경쟁으로

LLM경량화효율성엣지컴퓨팅온디바이스AI가속기탄소배출실용모델

노타, 이기종 컴퓨팅 기반 LLM 최적화 구현…"실행효율 제고 노력"

2026. 6. 4. 오전 8:53

노타, 이기종 컴퓨팅 기반 LLM 최적화 구현…"실행효율 제고 노력"

LLM이기종컴퓨팅추론최적화AIPCNPUGPU온디바이스AI에너지효율

노타, GPU·NPU 동시 활용 AI 추론 기술 구현에 13%↑[특징주]

2026. 6. 4. 오전 9:11

노타, GPU·NPU 동시 활용 AI 추론 기술 구현에 13%↑[특징주]

AI추론GPUNPULLM이기종컴퓨팅에너지효율온디바이스AI추론최적화

노타, GPU·NPU 역할 분담으로 온디바이스 AI 효율 높인다

2026. 6. 4. 오후 2:12

노타, GPU·NPU 역할 분담으로 온디바이스 AI 효율 높인다

온디바이스AIGPUNPU이기종컴퓨팅LLM추론최적화분리형추론에너지효율

노타, 'AI PC' GPU·NPU 동시 활용 최적화 기술 구현

2026. 6. 4. 오전 10:22

노타, 'AI PC' GPU·NPU 동시 활용 최적화 기술 구현

AIPCGPUNPULLM추론최적화이기종컴퓨팅온디바이스AI에너지효율

노타, GPU·NPU 동시 활용 AI 추론 구현…"AI PC 전력효율 개선"

2026. 6. 4. 오전 8:46

노타, GPU·NPU 동시 활용 AI 추론 구현…"AI PC 전력효율 개선"

AIPCGPUNPULLM추론이기종컴퓨팅전력효율온디바이스AI

아티크론, PIM 신규 과제 선정…온디바이스 LLM 겨냥

2026. 6. 2. 오후 4:12

아티크론, PIM 신규 과제 선정…온디바이스 LLM 겨냥

온디바이스AILLMPIM반도체인메모리컴퓨팅LPDDR6NPU메모리반도체AI플랫폼

퀄컴, 스냅드래곤 X2 엘리트 영역 확장...AI 미니 PC 공개

2026. 6. 2. 오후 11:14

퀄컴, 스냅드래곤 X2 엘리트 영역 확장...AI 미니 PC 공개

스냅드래곤AI미니PCNPU온디바이스AIARM프로세서에지컴퓨팅퀄컴

아티크론, PIM 신규 과제 선정…온디바이스 LLM 겨냥

2026. 6. 2. 오후 4:12

아티크론, PIM 신규 과제 선정…온디바이스 LLM 겨냥

인공지능반도체PIM기술온디바이스AI인메모리컴퓨팅LPDDR6메모리반도체LLMNPU

아티크론, PIM 신규 과제 선정…온디바이스 LLM 겨냥

2026. 6. 2. 오후 4:10

아티크론, PIM 신규 과제 선정…온디바이스 LLM 겨냥

AI반도체PIM기술온디바이스AI메모리컴퓨팅LPDDR6인메모리연산LLMNPU

"차세대 AI 엣지 플랫폼, AI 미니PC 시대 연다"…퀄컴·에이수스, ‘ASUS Ascent QN10’ 공개

인공지능신문

2026. 6. 2. 오전 11:41

"차세대 AI 엣지 플랫폼, AI 미니PC 시대 연다"…퀄컴·에이수스, ‘ASUS Ascent QN10’ 공개

AI미니PC엣지컴퓨팅스냅드래곤NPULLMAI에이전트저전력초소형폼팩터