article detail
[테크스냅] AI PC서 GPU·NPU 분산 활용…노타, LLM 추론 효율 높인다
2026. 6. 4. 오전 9:09
![[테크스냅] AI PC서 GPU·NPU 분산 활용…노타, LLM 추론 효율 높인다](https://img5.yna.co.kr/etc/inner/KR/2026/06/04/AKR20260604065000017_01_i_P4.jpg)
AI 요약
노타는 인텔 루나 레이크 기반 AI PC에서 GPU와 NPU를 함께 활용하는 분리형 추론을 적용해 단일 GPU 대비 토큰당 에너지 소비를 32% 절감하고 생성 처리량을 12% 높였으며 단일 NPU 대비 첫 응답 지연시간을 89% 단축했다고 4일 밝혔습니다. 에임인텔리전스는 법률·제도·문화적 맥락을 반영한 글로벌 벤치마크 XL-세이프티벤치를 공개해 한국·미국·인도·프랑스·독일·UAE 등 10개국을 대상으로 5천500개 현지화 테스트케이스로 37개 주요 LLM의 맥락 이해도를 측정했으며 논문은 아카이브에, 데이터셋은 허깅페이스에 공개했습니다. 엔닷라이트는 대만 MetAI와 MOU를 체결해 심 레디 3D 데이터 생성 엔진 트리닉스와 MetAI의 산업 규모 디지털 트윈 플랫폼 멧젠을 결합해 에셋 생성부터 환경 조립 및 시뮬레이션 학습까지 단일 워크플로우로 자동화하는 통합 파이프라인 구축에 나서기로 했습니다.







