IT뉴스모아news terminal

article detail

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

아이뉴스24GPULLM추론MoAINPU갤럭시성능최적화이종분산텐스토렌트

2026. 5. 4. 오전 9:56

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

AI 요약

모레는 텐스토렌트의 갤럭시 웜홀 시스템에 자사 MoAI 추론 프레임워크를 적용해 LLM 추론 성능을 입증했으며, 해당 성과를 5월 1일(현지 시각) 미국 샌프란시스코에서 열린 텐스토렌트 신제품 발표 행사(TT-Deploy)에서 공개했습니다. GPT-OSS, Qwen, GLM, DeepSeek 등 기준 테스트에서 텐스토렌트 갤럭시 웜홀 시스템이 엔비디아 DGX A100급 또는 그 이상의 LLM 추론 성능을 달성했으며, GPU와 텐스토렌트 웜홀 칩을 결합한 이종 분산 서빙 구조에서 텐스토렌트 칩을 prefill 전용 가속기로 활용해 HBM 사용을 줄이고 인프라 비용을 절감했다고 설명했습니다. MoAI 추론 프레임워크는 엔비디아, AMD, 텐스토렌트 등 이종 GPU 및 NPU를 단일 클러스터에서 통합 운용하는 분리 추론 솔루션이며, 모레는 향후 이종 GPU 간 KV 캐시 전송 효율화 등 성능 고도화를 추진할 계획이라고 밝혔습니다.

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

2026. 5. 4. 오전 9:57

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론갤럭시텐스토렌트MoAI이종분산GPUNPU인프라

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

2026. 5. 4. 오전 9:58

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoE모델분산서빙성능최적화추론가속비용절감

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

2026. 5. 4. 오후 4:12

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론갤럭시MoAI텐스토렌트이종가속기분산서빙HBMKV캐시

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

2026. 5. 4. 오전 9:57

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoE모델분산서빙성능최적화추론가속비용절감

AI PC 경쟁, 칩 성능 넘어 ‘시스템 최적화’로…노타, GPU·NPU 분리형 추론 구현

2026. 6. 4. 오전 9:33

AI PC 경쟁, 칩 성능 넘어 ‘시스템 최적화’로…노타, GPU·NPU 분리형 추론 구현

AIPC시스템최적화이기종컴퓨팅LLM추론GPUNPU에너지효율토큰생성

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

2026. 5. 4. 오전 9:58

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoE모델분산서빙성능테스트추론가속비용절감

“GPU 독점 흔드나”…모레, 캐나다 텐스토렌트와 LLM 추론 ‘DGX급 성능’ 입증

2026. 5. 4. 오후 12:06

“GPU 독점 흔드나”…모레, 캐나다 텐스토렌트와 LLM 추론 ‘DGX급 성능’ 입증

GPU독점LLM추론AI인프라이종분산MoE모델벤더독립성능최적화비용절감

[테크스냅] AI PC서 GPU·NPU 분산 활용…노타, LLM 추론 효율 높인다

2026. 6. 4. 오전 9:10

[테크스냅] AI PC서 GPU·NPU 분산 활용…노타, LLM 추론 효율 높인다

AIPCGPUNPULLM추론에너지효율벤치마크디지털트윈

노타, 이기종 컴퓨팅 기반 LLM 최적화 구현…"실행효율 제고 노력"

2026. 6. 4. 오전 8:53

노타, 이기종 컴퓨팅 기반 LLM 최적화 구현…"실행효율 제고 노력"

LLM이기종컴퓨팅추론최적화AIPCNPUGPU온디바이스AI에너지효율

[테크스냅] AI PC서 GPU·NPU 분산 활용…노타, LLM 추론 효율 높인다

2026. 6. 4. 오전 9:10

[테크스냅] AI PC서 GPU·NPU 분산 활용…노타, LLM 추론 효율 높인다

AIPCGPUNPULLM추론최적화이기종컴퓨팅에너지효율벤치마크

노타, GPU·NPU 동시 활용 AI 추론 기술 구현에 13%↑[특징주]

2026. 6. 4. 오전 9:11

노타, GPU·NPU 동시 활용 AI 추론 기술 구현에 13%↑[특징주]

AI추론GPUNPULLM이기종컴퓨팅에너지효율온디바이스AI추론최적화

노타, 이기종 컴퓨팅 기반 LLM 최적화 기술 구현

2026. 6. 4. 오전 9:12

노타, 이기종 컴퓨팅 기반 LLM 최적화 기술 구현

LLM최적화이기종컴퓨팅AIPCGPUNPU추론기술에너지효율처리량