IT뉴스모아news terminal

article detail

노타, AI PC용 이기종 컴퓨팅 LLM 최적화 구현

한스경제AIPCGPULLM최적화NPU에너지효율온디바이스AI이기종컴퓨팅추론최적화
2026. 6. 4. 오전 9:19
노타, AI PC용 이기종 컴퓨팅 LLM 최적화 구현

AI 요약

노타는 AI PC 환경에서 GPU와 NPU를 함께 활용하는 이기종 컴퓨팅 기반 LLM 추론 최적화 기술을 선보였으며, 입력 처리와 답변 생성 단계를 분리해 각 연산을 GPU와 NPU에 각각 배치하는 분리형 추론 방식을 적용했습니다. 이 방식으로 단일 GPU 실행 대비 토큰당 에너지 소비를 32% 줄이고 생성 처리량을 12% 높였으며, 단일 NPU 실행 대비 첫 응답 지연은 89% 감소했습니다. 이번 성능 평가는 인텔 루나 레이크 기반 AI PC, MoE LLM, context window size 512 조건에서 진행됐고 노타는 모델 경량화·런타임 최적화·하드웨어 최적화를 결합해 온디바이스 AI 실행 효율을 높이겠다고 밝혔습니다.

원문보기
feed://articles/related관련 기사
노타, 이기종 컴퓨팅 기반 LLM 최적화 기술 구현뉴스핌
2026. 6. 4. 오전 9:09

노타, 이기종 컴퓨팅 기반 LLM 최적화 기술 구현

LLM최적화이기종컴퓨팅AIPCGPUNPU추론최적화온디바이스AI에너지효율
노타, 'AI PC' GPU·NPU 동시 활용 최적화 기술 구현전자신문
2026. 6. 4. 오전 10:22

노타, 'AI PC' GPU·NPU 동시 활용 최적화 기술 구현

AIPCGPUNPULLM추론최적화이기종컴퓨팅온디바이스AI에너지효율
노타, 이기종 컴퓨팅 기반 LLM 최적화 구현...'실행효율 제고 노력'데일리한국
2026. 6. 4. 오전 8:52

노타, 이기종 컴퓨팅 기반 LLM 최적화 구현...'실행효율 제고 노력'

LLM최적화이기종컴퓨팅분리형추론AIPCNPUGPU에너지효율추론최적화
노타, 이기종 컴퓨팅 기반 거대언어모델 최적화…AI PC 효율 제고supple.kr
2026. 6. 4. 오전 8:52

노타, 이기종 컴퓨팅 기반 거대언어모델 최적화…AI PC 효율 제고

거대언어모델이기종컴퓨팅AIPC추론최적화GPUNPU온디바이스AI에너지효율
노타, GPU·NPU 역할 분담으로 온디바이스 AI 효율 높인다네이트
2026. 6. 4. 오후 2:12

노타, GPU·NPU 역할 분담으로 온디바이스 AI 효율 높인다

온디바이스AIGPUNPU이기종컴퓨팅LLM추론최적화분리형추론에너지효율
노타, 이기종 컴퓨팅 기반 LLM 최적화 성공…"AI PC 효율 극대화"네이트
2026. 6. 4. 오전 8:43

노타, 이기종 컴퓨팅 기반 LLM 최적화 성공…"AI PC 효율 극대화"

AIPCLLM최적화이기종컴퓨팅분리형추론NPUGPU에너지효율추론성능
노타, 이기종 컴퓨팅 기반 LLM 최적화 성공… "AI PC 효율 극대화"이데일리
2026. 6. 4. 오전 8:41

노타, 이기종 컴퓨팅 기반 LLM 최적화 성공… "AI PC 효율 극대화"

AIPCLLM최적화이기종컴퓨팅NPUGPU추론기술에너지효율생성처리량
노타, 이기종 컴퓨팅 기반 거대언어모델 최적화…AI PC 효율 제고네이트
2026. 6. 4. 오전 8:53

노타, 이기종 컴퓨팅 기반 거대언어모델 최적화…AI PC 효율 제고

AI최적화이기종컴퓨팅거대언어모델분리형추론에너지효율AIPCNPUGPU
노타, 이기종 컴퓨팅 기반 AI 추론 기술 개발..."GPU·NPU 역할 분배가 핵심"AI타임스
2026. 6. 4. 오후 12:27

노타, 이기종 컴퓨팅 기반 AI 추론 기술 개발..."GPU·NPU 역할 분배가 핵심"

이기종컴퓨팅AI추론LLMGPUNPUAIPC에너지효율온디바이스
AI PC 경쟁, 칩 성능 넘어 ‘시스템 최적화’로…노타, GPU·NPU 분리형 추론 구현테크42
2026. 6. 4. 오전 9:33

AI PC 경쟁, 칩 성능 넘어 ‘시스템 최적화’로…노타, GPU·NPU 분리형 추론 구현

AIPC시스템최적화이기종컴퓨팅LLM추론GPUNPU에너지효율토큰생성
노타, GPU·NPU 동시 활용 AI 추론 구현…"AI PC 전력효율 개선"이데일리
2026. 6. 4. 오전 8:46

노타, GPU·NPU 동시 활용 AI 추론 구현…"AI PC 전력효율 개선"

AIPCGPUNPULLM추론이기종컴퓨팅전력효율온디바이스AI
[테크스냅] AI PC서 GPU·NPU 분산 활용…노타, LLM 추론 효율 높인다연합뉴스
2026. 6. 4. 오전 9:09

[테크스냅] AI PC서 GPU·NPU 분산 활용…노타, LLM 추론 효율 높인다

AIPCGPUNPULLM추론에너지효율D데이터디지털트윈