IT뉴스모아news terminal

article detail

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능·안정성 확보

데이터넷HBMLLM추론MoE모델가속기분산서빙추론성능칩설계텐스토렌트
2026. 5. 4. 오전 10:05
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능·안정성 확보

AI 요약

모레는 텐스토렌트 갤럭시 웜홀 시스템에 자사 MoAI 추론 프레임워크를 적용해 미국 샌프란시스코에서 열린 텐스토렌트 신제품 발표 행사(TT-Deploy)에서 GPT-OSS, 큐웬, GLM, 딥시크 등 최신 MoE 모델 기준으로 엔비디아 DGX A100급 또는 그 이상의 LLM 추론 성능을 입증했다고 발표했습니다. 모레는 GPU와 텐스토렌트 웜홀 칩을 결합한 이종 분산 서빙 구조로 텐스토렌트 칩을 입력 처리 전용 가속기로 활용해 HBM 사용을 줄이고 전체 인프라 비용을 절감했다고 설명했습니다. 모레는 사업 확장을 위해 1000만원의 사이닝 보너스를 내걸고 5월 말까지 엔지니어와 사업 개발 전 직군에 걸쳐 공채를 진행하고 있습니다.

원문보기
feed://articles/related관련 기사
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증v.daum.net
2026. 5. 4. 오전 9:58

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoE모델분산서빙성능테스트추론가속비용절감
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증v.daum.net
2026. 5. 4. 오전 9:58

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoE모델분산서빙성능최적화추론가속비용절감
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증전자신문
2026. 5. 4. 오후 4:12

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론갤럭시MoAI텐스토렌트이종가속기분산서빙HBMKV캐시
모레, 텐스토렌트 시스템의 LLM 추론 성능 입증…"GPU 중심 인프라 대체"AI타임스
2026. 5. 4. 오후 12:56

모레, 텐스토렌트 시스템의 LLM 추론 성능 입증…"GPU 중심 인프라 대체"

LLM추론GPU대체텐스토렌트MoE모델이종칩통합분산서빙HBM절감KV캐시
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증네이트
2026. 5. 4. 오전 9:57

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoE모델분산서빙성능최적화추론가속비용절감
Shaking up the GPU dominance… Successfully proving 'DGX-class' Tensorrent-based LLM inference performance the day after tomorrow벤처스퀘어
2026. 5. 4. 오후 4:26

Shaking up the GPU dominance… Successfully proving 'DGX-class' Tensorrent-based LLM inference performance the day after tomorrow

LLM추론GPU대안MoE모델이종칩통합비용효율가속기데이터센터
48조 ‘세레브라스’ 상장… 제2의 엔비디아? 거품 판별할 숫자 3가지글로벌이코노믹
2026. 5. 12. 오전 3:35

48조 ‘세레브라스’ 상장… 제2의 엔비디아? 거품 판별할 숫자 3가지

AI칩상장엔비디아칩설계현금소진고객유지HBM실적증명
"GPU 독점 흔드나"…모레, 캐나다 텐스토렌트와 LLM 추론 'DGX급 성능' 입증네이트
2026. 5. 4. 오후 12:08

"GPU 독점 흔드나"…모레, 캐나다 텐스토렌트와 LLM 추론 'DGX급 성능' 입증

GPU독점LLM추론AI가속기멀티벤더분산서빙추론프레임워크비용최적화이종칩통합
“GPU 독점 흔드나”…모레, 캐나다 텐스토렌트와 LLM 추론 ‘DGX급 성능’ 입증이데일리
2026. 5. 4. 오후 12:06

“GPU 독점 흔드나”…모레, 캐나다 텐스토렌트와 LLM 추론 ‘DGX급 성능’ 입증

GPU독점LLM추론AI인프라이종분산MoE모델벤더독립성능최적화비용절감
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증아이뉴스24
2026. 5. 4. 오전 9:56

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoAI이종분산GPUNPU성능최적화
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증네이트
2026. 5. 4. 오전 9:57

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론갤럭시텐스토렌트MoAI이종분산GPUNPU인프라
큐알티, 하이퍼엑셀과 AI 반도체 신뢰성 협력디일렉
2026. 4. 30. 오후 5:39

큐알티, 하이퍼엑셀과 AI 반도체 신뢰성 협력

AI반도체신뢰성평가품질관리반도체스타트업LLM추론가속기협력체계메모리평가