article detail
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증
2026. 5. 4. 오전 9:58
AI 요약
모레는 텐스토렌트의 갤럭시 웜홀 시스템에 자사 MoAI 추론 프레임워크를 적용해 LLM 추론 성능을 입증했다고 4일 밝혔습니다. GPT-OSS, Qwen, GLM, DeepSeek 등 최신 MoE 모델 기준 테스트에서 텐스토렌트 갤럭시 웜홀 시스템이 엔비디아 DGX A100급 또는 그 이상의 추론 성능을 달성했으며 GPU와 텐스토렌트 칩을 결합한 이종 분산 서빙 구조로 텐스토렌트 칩을 prefill 전용 가속기로 활용해 HBM 사용을 줄이고 인프라 비용을 절감했다고 설명했습니다.




