article detail
“GPU 독점 흔드나”…모레, 캐나다 텐스토렌트와 LLM 추론 ‘DGX급 성능’ 입증
2026. 5. 4. 오후 12:06

AI 요약
AI 인프라 솔루션 기업 모레가 캐나다 텐스토렌트와 협업해 텐스토렌트의 갤럭시 웜홀 시스템에 자사 MoAI 추론 프레임워크를 적용한 결과 LLM 추론에서 엔비디아의 DGX A100급 이상의 성능을 달성했다고 5월 1일 샌프란시스코 TT-Deploy 행사에서 공개했습니다. 모레는 GPU와 텐스토렌트 칩을 결합한 이종 분산 서빙 구조로 텐스토렌트 칩을 입력 처리 전용 가속기로 활용해 HBM 사용량과 전체 인프라 비용을 낮췄고, GPT-OSS·큐웬·GLM·딥시크 등 최신 MoE 모델에서 동등하거나 상회하는 성능을 확인했다고 밝혔습니다. 또한 MoAI 추론 프레임워크가 엔비디아·AMD·텐스토렌트 등 다양한 GPU·NPU를 하나의 클러스터에서 통합 운용할 수 있어 특정 벤더 종속을 낮추고 멀티 벤더 기반의 유연한 AI 인프라 설계가 가능하다고 설명했습니다.


