article detail
"GPU 독점 흔드나"…모레, 캐나다 텐스토렌트와 LLM 추론 'DGX급 성능' 입증
2026. 5. 4. 오후 12:08
AI 요약
모레는 텐스토렌트와 협업해 텐스토렌트의 갤럭시 웜홀 시스템에 자사 MoAI 추론 프레임워크를 적용한 결과, 대형언어모델(LLM) 추론에서 엔비디아 DGX A100급 이상의 성능을 달성했다고 5월 1일 미국 샌프란시스코에서 열린 TT-Deploy에서 공개했습니다. 모레는 이종 분산 서빙 구조로 텐스토렌트 칩을 입력 처리 전용 가속기로 활용해 HBM 사용량을 줄이고 전체 인프라 비용을 낮췄다고 설명했습니다. MoAI 추론 프레임워크는 엔비디아, AMD, 텐스토렌트 등 다양한 GPU·NPU를 하나의 클러스터에서 통합 운용할 수 있어 멀티 벤더 기반의 유연한 AI 인프라 설계를 가능하게 한다고 모레는 밝혔습니다.




