article detail
[테크스냅] AI PC서 GPU·NPU 분산 활용…노타, LLM 추론 효율 높인다
2026. 6. 4. 오전 9:09
![[테크스냅] AI PC서 GPU·NPU 분산 활용…노타, LLM 추론 효율 높인다](https://img5.yna.co.kr/etc/inner/KR/2026/06/04/AKR20260604065000017_01_i_P4.jpg)
AI 요약
AI 경량화 전문기업 노타는 인텔 루나 레이크 기반 AI PC에서 GPU와 NPU를 함께 활용하는 이기종 컴퓨팅 기반 분리형 추론 기술을 구현해 단일 GPU 대비 토큰당 에너지 소비를 32% 절감하고 생성 처리량을 12% 높였으며 단일 NPU 대비 첫 응답 지연시간을 89% 단축했습니다. AI 보안 전문기업 에임인텔리전스는 한국·미국·인도·프랑스·독일·UAE 등 10개국을 대상으로 5천500개 현지화 테스트 케이스로 37개 주요 LLM의 법적·문화적 맥락 이해도를 측정하는 글로벌 벤치마크 XL-세이프티벤치를 공개했으며 마이크로소프트, KT, BMW그룹, 한국 AI안전연구소 등 10개 기관의 17명이 공동 저자로 참여하고 논문은 아카이브에, 데이터셋은 허깅페이스에 공개했습니다. 3D AI 전문기업 엔닷라이트는 엔비디아가 대만 스타트업 중 최초로 직접 투자한 산업용 디지털 트윈 기업 MetAI와 MOU를 체결해 엔닷라이트의 SimReady 3D 데이터 생성 엔진 트리닉스와 MetAI의 산업 규모 디지털 트윈 플랫폼 멧젠을 결합해 에셋 생성부터 환경 조립, 시뮬레이션 학습까지 단일 워크플로우로 자동화하는 통합 파이프라인을 구축하기로 했습니다.







