IT뉴스모아news terminal

article detail

“GPU 독점 흔드나”…모레, 캐나다 텐스토렌트와 LLM 추론 ‘DGX급 성능’ 입증

이데일리AI인프라GPU독점LLM추론MoE모델벤더독립비용절감성능최적화이종분산
2026. 5. 4. 오후 12:06
“GPU 독점 흔드나”…모레, 캐나다 텐스토렌트와 LLM 추론 ‘DGX급 성능’ 입증

AI 요약

AI 인프라 솔루션 기업 모레가 캐나다 텐스토렌트와 협업해 텐스토렌트의 갤럭시 웜홀 시스템에 자사 MoAI 추론 프레임워크를 적용한 결과 LLM 추론에서 엔비디아의 DGX A100급 이상의 성능을 달성했다고 5월 1일 샌프란시스코 TT-Deploy 행사에서 공개했습니다. 모레는 GPU와 텐스토렌트 칩을 결합한 이종 분산 서빙 구조로 텐스토렌트 칩을 입력 처리 전용 가속기로 활용해 HBM 사용량과 전체 인프라 비용을 낮췄고, GPT-OSS·큐웬·GLM·딥시크 등 최신 MoE 모델에서 동등하거나 상회하는 성능을 확인했다고 밝혔습니다. 또한 MoAI 추론 프레임워크가 엔비디아·AMD·텐스토렌트 등 다양한 GPU·NPU를 하나의 클러스터에서 통합 운용할 수 있어 특정 벤더 종속을 낮추고 멀티 벤더 기반의 유연한 AI 인프라 설계가 가능하다고 설명했습니다.

원문보기
feed://articles/related관련 기사
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증v.daum.net
2026. 5. 4. 오전 9:58

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoE모델분산서빙성능최적화추론가속비용절감
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증네이트
2026. 5. 4. 오전 9:57

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoE모델분산서빙성능최적화추론가속비용절감
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증v.daum.net
2026. 5. 4. 오전 9:58

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoE모델분산서빙성능테스트추론가속비용절감
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증아이뉴스24
2026. 5. 4. 오전 9:56

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoAI이종분산GPUNPU성능최적화
이슬림코리아·텐스토렌트, ‘AI EXPO KOREA 2026’서 차세대 AI 가속기 ‘블랙홀’ 국내 공개인공지능신문
2026. 5. 12. 오후 5:59

이슬림코리아·텐스토렌트, ‘AI EXPO KOREA 2026’서 차세대 AI 가속기 ‘블랙홀’ 국내 공개

AI가속기RISC-VLLM추론생성형AI서버시스템텐서처리비용절감프레임워크
"GPU 독점 흔드나"…모레, 캐나다 텐스토렌트와 LLM 추론 'DGX급 성능' 입증네이트
2026. 5. 4. 오후 12:08

"GPU 독점 흔드나"…모레, 캐나다 텐스토렌트와 LLM 추론 'DGX급 성능' 입증

GPU독점LLM추론AI가속기멀티벤더분산서빙추론프레임워크비용최적화이종칩통합
Shaking up the GPU dominance… Successfully proving 'DGX-class' Tensorrent-based LLM inference performance the day after tomorrow벤처스퀘어
2026. 5. 4. 오후 4:26

Shaking up the GPU dominance… Successfully proving 'DGX-class' Tensorrent-based LLM inference performance the day after tomorrow

LLM추론GPU대안MoE모델이종칩통합비용효율가속기데이터센터
모레, 텐스토렌트 시스템의 LLM 추론 성능 입증…"GPU 중심 인프라 대체"AI타임스
2026. 5. 4. 오후 12:56

모레, 텐스토렌트 시스템의 LLM 추론 성능 입증…"GPU 중심 인프라 대체"

LLM추론GPU대체텐스토렌트MoE모델이종칩통합분산서빙HBM절감KV캐시
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능·안정성 확보데이터넷
2026. 5. 4. 오전 10:05

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능·안정성 확보

LLM추론텐스토렌트MoE모델분산서빙추론성능가속기HBM칩설계
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증네이트
2026. 5. 4. 오전 9:57

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론갤럭시텐스토렌트MoAI이종분산GPUNPU인프라
메타, AWS 그라비톤 칩 대규모 도입 추진…AI 인프라 투자 확대 가속비즈월드
2026. 4. 28. 오전 7:22

메타, AWS 그라비톤 칩 대규모 도입 추진…AI 인프라 투자 확대 가속

AI인프라그라비톤ARM칩메타AWS데이터센터전력효율비용절감
“비용 낮추고 속도 높이고”...엘리스그룹, 이동형 데이터센터로 ‘AI 가성비’ 시대 연다v.daum.net
2026. 4. 15. 오후 7:45

“비용 낮추고 속도 높이고”...엘리스그룹, 이동형 데이터센터로 ‘AI 가성비’ 시대 연다

데이터센터모듈형GPUAI인프라비용절감냉각시스템클러스터링AI솔루션