IT뉴스모아news terminal

article detail

노타, 이기종 컴퓨팅 기반 LLM 최적화 구현…"실행효율 제고 노력"

네이트AIPCGPULLMNPU에너지효율온디바이스AI이기종컴퓨팅추론최적화

2026. 6. 4. 오전 8:53

노타, 이기종 컴퓨팅 기반 LLM 최적화 구현…"실행효율 제고 노력"

AI 요약

노타가 4일 인텔 루나 레이크(Intel Lunar Lake) 기반 AI PC에서 GPU와 NPU를 함께 활용하는 이기종 컴퓨팅 기반 대형 언어 모델(LLM) 추론 최적화 기술을 구현하고, 입력 처리와 답변 생성 연산을 분리해 각 연산에 적합한 장치에 배치하는 분리형 추론(Disaggregated Inference) 방식을 적용했다고 밝혔습니다. 성능 평가에서 분리형 추론은 단일 GPU 실행 방식 대비 토큰당 에너지 소비를 약 32% 줄이고 생성 처리량을 약 12% 높였으며, 단일 NPU 실행 방식 대비 첫 응답 지연시간을 약 89% 단축했다고 설명했습니다. 노타 채명수 대표는 다양한 연산 장치를 모델 특성에 맞게 조합하는 최적화 역량이 실제 AI 경험을 좌우한다며 모델 경량화·런타임 최적화·하드웨어 최적화 기술을 결합해 온디바이스 AI 실행 효율을 높이겠다고 밝혔습니다.

노타, 'AI PC' GPU·NPU 동시 활용 최적화 기술 구현

2026. 6. 4. 오전 10:22

노타, 'AI PC' GPU·NPU 동시 활용 최적화 기술 구현

AIPCGPUNPULLM추론최적화이기종컴퓨팅온디바이스AI에너지효율

[테크스냅] AI PC서 GPU·NPU 분산 활용…노타, LLM 추론 효율 높인다

2026. 6. 4. 오전 9:10

[테크스냅] AI PC서 GPU·NPU 분산 활용…노타, LLM 추론 효율 높인다

AIPCGPUNPULLM추론최적화이기종컴퓨팅에너지효율벤치마크

노타, GPU·NPU 동시 활용 AI 추론 기술 구현에 13%↑[특징주]

2026. 6. 4. 오전 9:11

노타, GPU·NPU 동시 활용 AI 추론 기술 구현에 13%↑[특징주]

AI추론GPUNPULLM이기종컴퓨팅에너지효율온디바이스AI추론최적화

노타, GPU·NPU 분산 추론으로 AI PC LLM 효율 개선

2026. 6. 4. 오후 1:57

노타, GPU·NPU 분산 추론으로 AI PC LLM 효율 개선

AIPCLLMGPUNPU추론최적화이기종컴퓨팅에너지효율시스템최적화

노타, GPU·NPU 역할 분담으로 온디바이스 AI 효율 높인다

2026. 6. 4. 오후 2:12

노타, GPU·NPU 역할 분담으로 온디바이스 AI 효율 높인다

온디바이스AIGPUNPU이기종컴퓨팅LLM추론최적화분리형추론에너지효율

노타, 이기종 컴퓨팅 기반 LLM 최적화 기술 구현

2026. 6. 4. 오전 9:09

노타, 이기종 컴퓨팅 기반 LLM 최적화 기술 구현

LLM최적화이기종컴퓨팅AIPCGPUNPU추론최적화온디바이스AI에너지효율

노타, AI PC용 이기종 컴퓨팅 LLM 최적화 구현

2026. 6. 4. 오전 9:19

노타, AI PC용 이기종 컴퓨팅 LLM 최적화 구현

AIPC이기종컴퓨팅LLM최적화GPUNPU추론최적화에너지효율온디바이스AI

노타, 이기종 컴퓨팅 기반 거대언어모델 최적화…AI PC 효율 제고

2026. 6. 4. 오전 8:52

노타, 이기종 컴퓨팅 기반 거대언어모델 최적화…AI PC 효율 제고

거대언어모델이기종컴퓨팅AIPC추론최적화GPUNPU온디바이스AI에너지효율

노타, 이기종 컴퓨팅 기반 거대언어모델 최적화…AI PC 효율 제고

2026. 6. 4. 오전 8:53

노타, 이기종 컴퓨팅 기반 거대언어모델 최적화…AI PC 효율 제고

거대언어모델AIPC분리형추론이기종컴퓨팅NPUGPU에너지효율추론최적화

노타, 이기종 컴퓨팅 기반 AI 추론 기술 개발..."GPU·NPU 역할 분배가 핵심"

2026. 6. 4. 오후 12:27

노타, 이기종 컴퓨팅 기반 AI 추론 기술 개발..."GPU·NPU 역할 분배가 핵심"

이기종컴퓨팅AI추론LLMGPUNPUAIPC에너지효율온디바이스

노타, 이기종 컴퓨팅 기반 LLM 최적화 구현...'실행효율 제고 노력'

데일리한국

2026. 6. 4. 오전 8:52

노타, 이기종 컴퓨팅 기반 LLM 최적화 구현...'실행효율 제고 노력'

LLM최적화이기종컴퓨팅분리형추론AIPCNPUGPU에너지효율추론최적화

노타, GPU·NPU 동시 활용 AI 추론 구현…"AI PC 전력효율 개선"

2026. 6. 4. 오전 8:46

노타, GPU·NPU 동시 활용 AI 추론 구현…"AI PC 전력효율 개선"

AIPCGPUNPULLM추론이기종컴퓨팅전력효율온디바이스AI