article detail
스냅드래곤 8 엘리트 5세대 NPU 성능은?…'실리콘 고문' 해봤더니
2026. 4. 22. 오후 5:00

AI 요약
스냅드래곤 8 엘리트 5세대(Gen 5)는 신경망처리장치(NPU) 성능이 이전 세대 대비 37~39% 향상됐으며, 네트워크를 차단한 상태에서 MLC LLM 기반 MLC Chat 앱으로 메타의 라마 3(Llama-3)-8B(70억~80억 파라미터, 4비트 양자화(INT4)) 모델을 가동해 NPU 성능을 시험했습니다. 테스트에서 프리필은 68 tok/s, 디코드는 초기 25.1 tok/s를 기록했고 소설·대본 창작 등 고난도 작업에서도 약 20 tok/s 수준을 유지하다가 장시간 사용 시 일시적으로 15 tok/s로 하락했으나 기기 발열은 느껴지지 않았고 앱 재기동 시 즉시 25 tok/s로 복귀해 이는 NPU 성능보다는 LLM 모델의 최적화 이슈로 추정된다고 보도했습니다. 디코드 20 tok/s 이상은 사람 평균 읽기 속도보다 3~4배 빠른 수준이며 앞선 세대 AP들이 최고 14~15 tok/s였던 것과 비교해 성능 향상이 뚜렷하고, 이러한 디바이스 내 AI 연산 능력은 콘텐츠 제작과 개인 맞춤형 추천 등 갤럭시 AI의 File Overview, Nightography 비디오, Photo Assist, Now Nudge 등 기능에서 활용 폭을 넓혀 갤럭시 S26 울트라 등에서 콘텐츠 제작에 기여한다고 전했습니다.


![[AI세계속으로]구글 터보퀀트, 삼전닉스 영향은…세계AI학회에 쏠린 눈](https://cphoto.asiae.co.kr/listimglink/1/2026041912044531328_1776567885.png)




![[AI TECH 2026] Vision AI·사운드 AI·자율제조…산업별 AX 성공 조건 한자리에](https://www.hellot.net/data/photos/20260417/art_17768451170639_4ee271.jpg)