IT뉴스모아news terminal

article detail

"GPU 독점 흔드나"…모레, 캐나다 텐스토렌트와 LLM 추론 'DGX급 성능' 입증

네이트AI가속기GPU독점LLM추론멀티벤더분산서빙비용최적화이종칩통합추론프레임워크
2026. 5. 4. 오후 12:08
"GPU 독점 흔드나"…모레, 캐나다 텐스토렌트와 LLM 추론 'DGX급 성능' 입증

AI 요약

모레는 텐스토렌트와 협업해 텐스토렌트의 갤럭시 웜홀 시스템에 자사 MoAI 추론 프레임워크를 적용한 결과, 대형언어모델(LLM) 추론에서 엔비디아 DGX A100급 이상의 성능을 달성했다고 5월 1일 미국 샌프란시스코에서 열린 TT-Deploy에서 공개했습니다. 모레는 이종 분산 서빙 구조로 텐스토렌트 칩을 입력 처리 전용 가속기로 활용해 HBM 사용량을 줄이고 전체 인프라 비용을 낮췄다고 설명했습니다. MoAI 추론 프레임워크는 엔비디아, AMD, 텐스토렌트 등 다양한 GPU·NPU를 하나의 클러스터에서 통합 운용할 수 있어 멀티 벤더 기반의 유연한 AI 인프라 설계를 가능하게 한다고 모레는 밝혔습니다.

원문보기
feed://articles/related관련 기사
모레, 텐스토렌트 시스템의 LLM 추론 성능 입증…"GPU 중심 인프라 대체"AI타임스
2026. 5. 4. 오후 12:56

모레, 텐스토렌트 시스템의 LLM 추론 성능 입증…"GPU 중심 인프라 대체"

LLM추론GPU대체텐스토렌트MoE모델이종칩통합분산서빙HBM절감KV캐시
이슬림코리아·텐스토렌트, ‘AI EXPO KOREA 2026’서 차세대 AI 가속기 ‘블랙홀’ 국내 공개인공지능신문
2026. 5. 12. 오후 5:59

이슬림코리아·텐스토렌트, ‘AI EXPO KOREA 2026’서 차세대 AI 가속기 ‘블랙홀’ 국내 공개

AI가속기RISC-VLLM추론생성형AI서버시스템텐서처리비용절감프레임워크
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증v.daum.net
2026. 5. 4. 오전 9:58

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoE모델분산서빙성능테스트추론가속비용절감
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증v.daum.net
2026. 5. 4. 오전 9:58

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoE모델분산서빙성능최적화추론가속비용절감
Shaking up the GPU dominance… Successfully proving 'DGX-class' Tensorrent-based LLM inference performance the day after tomorrow벤처스퀘어
2026. 5. 4. 오후 4:26

Shaking up the GPU dominance… Successfully proving 'DGX-class' Tensorrent-based LLM inference performance the day after tomorrow

LLM추론GPU대안MoE모델이종칩통합비용효율가속기데이터센터
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증전자신문
2026. 5. 4. 오후 4:12

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론갤럭시MoAI텐스토렌트이종가속기분산서빙HBMKV캐시
“GPU 독점 흔드나”…모레, 캐나다 텐스토렌트와 LLM 추론 ‘DGX급 성능’ 입증이데일리
2026. 5. 4. 오후 12:06

“GPU 독점 흔드나”…모레, 캐나다 텐스토렌트와 LLM 추론 ‘DGX급 성능’ 입증

GPU독점LLM추론AI인프라이종분산MoE모델벤더독립성능최적화비용절감
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증네이트
2026. 5. 4. 오전 9:57

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoE모델분산서빙성능최적화추론가속비용절감
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능·안정성 확보데이터넷
2026. 5. 4. 오전 10:05

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능·안정성 확보

LLM추론텐스토렌트MoE모델분산서빙추론성능가속기HBM칩설계
파미셀, 1Q 매출 367억·영업익 130억…AI 수혜에 역대 최대 실적 경신팜이데일리
2026. 5. 12. 오전 11:12

파미셀, 1Q 매출 367억·영업익 130억…AI 수혜에 역대 최대 실적 경신

AI가속기저유전율전자소재바이오케미컬G네트워크생산능력실적성장수요증가
[현장] 오픈텍스트 "AI 실행력, 데이터 관리에 달렸다"…운영·비용 최적화 전략 공개v.daum.net
2026. 5. 12. 오전 11:18

[현장] 오픈텍스트 "AI 실행력, 데이터 관리에 달렸다"…운영·비용 최적화 전략 공개

AI실행력데이터관리정보관리엔터프라이즈비정형데이터거버넌스AI에이전트비용최적화
‘마크다운인가, HTML인가’ 그 너머의 질문 [이승현의 AI 네이티브]IT조선
2026. 5. 12. 오전 6:00

‘마크다운인가, HTML인가’ 그 너머의 질문 [이승현의 AI 네이티브]

AI에이전트마크다운HTML출력토큰프로토타입시각화문서형식비용최적화