IT뉴스모아news terminal

article detail

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

네이트LLM추론MoE모델갤럭시분산서빙비용절감성능최적화추론가속텐스토렌트
2026. 5. 4. 오전 9:57
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

AI 요약

모레는 텐스토렌트의 갤럭시 웜홀 시스템에 자사 MoAI 추론 프레임워크를 적용해 5월 1일(현지 시각) 미국 샌프란시스코에서 열린 텐스토렌트 신제품 발표 행사(TT-Deploy)에서 LLM 추론 성능을 입증했다고 4일 밝혔습니다. GPT-OSS, Qwen, GLM, DeepSeek 등 최신 MoE 모델 기준 테스트에서 텐스토렌트 갤럭시 웜홀이 엔비디아 DGX A100급 또는 그 이상의 LLM 추론 성능을 달성했다고 밝혔습니다. 모레는 GPU와 텐스토렌트 웜홀 칩을 결합한 이종 분산 서빙 구조에서 텐스토렌트 칩을 prefill 전용 가속기로 활용해 HBM 사용을 줄이고 전체 인프라 비용을 절감했다고 설명했습니다.

원문보기
feed://articles/related관련 기사
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증v.daum.net
2026. 5. 4. 오전 9:58

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoE모델분산서빙성능최적화추론가속비용절감
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증v.daum.net
2026. 5. 4. 오전 9:58

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoE모델분산서빙성능테스트추론가속비용절감
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증전자신문
2026. 5. 4. 오후 4:12

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론갤럭시MoAI텐스토렌트이종가속기분산서빙HBMKV캐시
모레, 텐스토렌트 시스템의 LLM 추론 성능 입증…"GPU 중심 인프라 대체"AI타임스
2026. 5. 4. 오후 12:56

모레, 텐스토렌트 시스템의 LLM 추론 성능 입증…"GPU 중심 인프라 대체"

LLM추론GPU대체텐스토렌트MoE모델이종칩통합분산서빙HBM절감KV캐시
“GPU 독점 흔드나”…모레, 캐나다 텐스토렌트와 LLM 추론 ‘DGX급 성능’ 입증이데일리
2026. 5. 4. 오후 12:06

“GPU 독점 흔드나”…모레, 캐나다 텐스토렌트와 LLM 추론 ‘DGX급 성능’ 입증

GPU독점LLM추론AI인프라이종분산MoE모델벤더독립성능최적화비용절감
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증아이뉴스24
2026. 5. 4. 오전 9:56

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoAI이종분산GPUNPU성능최적화
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능·안정성 확보데이터넷
2026. 5. 4. 오전 10:05

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능·안정성 확보

LLM추론텐스토렌트MoE모델분산서빙추론성능가속기HBM칩설계
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증네이트
2026. 5. 4. 오전 9:57

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론갤럭시텐스토렌트MoAI이종분산GPUNPU인프라
이슬림코리아·텐스토렌트, ‘AI EXPO KOREA 2026’서 차세대 AI 가속기 ‘블랙홀’ 국내 공개인공지능신문
2026. 5. 12. 오후 5:59

이슬림코리아·텐스토렌트, ‘AI EXPO KOREA 2026’서 차세대 AI 가속기 ‘블랙홀’ 국내 공개

AI가속기RISC-VLLM추론생성형AI서버시스템텐서처리비용절감프레임워크
"GPU 독점 흔드나"…모레, 캐나다 텐스토렌트와 LLM 추론 'DGX급 성능' 입증네이트
2026. 5. 4. 오후 12:08

"GPU 독점 흔드나"…모레, 캐나다 텐스토렌트와 LLM 추론 'DGX급 성능' 입증

GPU독점LLM추론AI가속기멀티벤더분산서빙추론프레임워크비용최적화이종칩통합
Shaking up the GPU dominance… Successfully proving 'DGX-class' Tensorrent-based LLM inference performance the day after tomorrow벤처스퀘어
2026. 5. 4. 오후 4:26

Shaking up the GPU dominance… Successfully proving 'DGX-class' Tensorrent-based LLM inference performance the day after tomorrow

LLM추론GPU대안MoE모델이종칩통합비용효율가속기데이터센터
시맨틱스 적용한 조직, 에이전틱 AI 정확도 최대 80% 향상 및 비용 최대 60% 절감인공지능신문
2026. 5. 12. 오후 8:22

시맨틱스 적용한 조직, 에이전틱 AI 정확도 최대 80% 향상 및 비용 최대 60% 절감

에이전틱AI시맨틱스정확도향상비용절감AI거버넌스데이터거버넌스컨텍스트신뢰성