IT뉴스모아news terminal

article detail

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

아이뉴스24GPULLM추론MoAINPU갤럭시성능최적화이종분산텐스토렌트
2026. 5. 4. 오전 9:56
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

AI 요약

모레는 텐스토렌트의 갤럭시 웜홀 시스템에 자사 MoAI 추론 프레임워크를 적용해 LLM 추론 성능을 입증했으며, 해당 성과를 5월 1일(현지 시각) 미국 샌프란시스코에서 열린 텐스토렌트 신제품 발표 행사(TT-Deploy)에서 공개했습니다. GPT-OSS, Qwen, GLM, DeepSeek 등 기준 테스트에서 텐스토렌트 갤럭시 웜홀 시스템이 엔비디아 DGX A100급 또는 그 이상의 LLM 추론 성능을 달성했으며, GPU와 텐스토렌트 웜홀 칩을 결합한 이종 분산 서빙 구조에서 텐스토렌트 칩을 prefill 전용 가속기로 활용해 HBM 사용을 줄이고 인프라 비용을 절감했다고 설명했습니다. MoAI 추론 프레임워크는 엔비디아, AMD, 텐스토렌트 등 이종 GPU 및 NPU를 단일 클러스터에서 통합 운용하는 분리 추론 솔루션이며, 모레는 향후 이종 GPU 간 KV 캐시 전송 효율화 등 성능 고도화를 추진할 계획이라고 밝혔습니다.

원문보기
feed://articles/related관련 기사
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증네이트
2026. 5. 4. 오전 9:57

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론갤럭시텐스토렌트MoAI이종분산GPUNPU인프라
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증v.daum.net
2026. 5. 4. 오전 9:58

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoE모델분산서빙성능최적화추론가속비용절감
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증전자신문
2026. 5. 4. 오후 4:12

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론갤럭시MoAI텐스토렌트이종가속기분산서빙HBMKV캐시
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증네이트
2026. 5. 4. 오전 9:57

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoE모델분산서빙성능최적화추론가속비용절감
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증v.daum.net
2026. 5. 4. 오전 9:58

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoE모델분산서빙성능테스트추론가속비용절감
“GPU 독점 흔드나”…모레, 캐나다 텐스토렌트와 LLM 추론 ‘DGX급 성능’ 입증이데일리
2026. 5. 4. 오후 12:06

“GPU 독점 흔드나”…모레, 캐나다 텐스토렌트와 LLM 추론 ‘DGX급 성능’ 입증

GPU독점LLM추론AI인프라이종분산MoE모델벤더독립성능최적화비용절감
한국거래소, 판교서 AI 대표기업 5곳 CEO 간담회비즈월드
2026. 5. 5. 오전 3:41

한국거래소, 판교서 AI 대표기업 5곳 CEO 간담회

AI반도체NPULLMGPU상장제도온디바이스추론칩문서처리
모레, 텐스토렌트 시스템의 LLM 추론 성능 입증…"GPU 중심 인프라 대체"AI타임스
2026. 5. 4. 오후 12:56

모레, 텐스토렌트 시스템의 LLM 추론 성능 입증…"GPU 중심 인프라 대체"

LLM추론GPU대체텐스토렌트MoE모델이종칩통합분산서빙HBM절감KV캐시
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능·안정성 확보데이터넷
2026. 5. 4. 오전 10:05

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능·안정성 확보

LLM추론텐스토렌트MoE모델분산서빙추론성능가속기HBM칩설계
“AI 고속도로 구축 본격화”…국가 AI컴퓨팅센터, 1.5만장 반도체 기반 ‘소버린 인프라’ 시동인공지능신문
2026. 5. 3. 오후 5:09

“AI 고속도로 구축 본격화”…국가 AI컴퓨팅센터, 1.5만장 반도체 기반 ‘소버린 인프라’ 시동

AI컴퓨팅반도체인프라소버린AI데이터센터GPUNPU정부투자
김주영 하이퍼엑셀 대표 “LLM 특화 AI 반도체로 승부”서울경제
2026. 4. 25. 오전 9:00

김주영 하이퍼엑셀 대표 “LLM 특화 AI 반도체로 승부”

AI반도체LLMNPU저전력온디바이스데이터센터GPU메모리대역폭
HP, 차세대 AI PC 및 워크스테이션으로 구현하는 ‘일의 미래’ 공개캐드앤그래픽스
2026. 4. 28. 오후 2:56

HP, 차세대 AI PC 및 워크스테이션으로 구현하는 ‘일의 미래’ 공개

AIPC워크스테이션온디바이스NPU배터리GPU보안에이전트AI