IT뉴스모아news terminal

article detail

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

v.daum.netLLM추론MoE모델갤럭시분산서빙비용절감성능테스트추론가속텐스토렌트
2026. 5. 4. 오전 9:58
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

AI 요약

모레는 텐스토렌트의 갤럭시 웜홀 시스템에 자사 MoAI 추론 프레임워크를 적용해 LLM 추론 성능을 입증했다고 4일 밝혔습니다. GPT-OSS, Qwen, GLM, DeepSeek 등 최신 MoE 모델 기준 테스트에서 텐스토렌트 갤럭시 웜홀 시스템이 엔비디아 DGX A100급 또는 그 이상의 추론 성능을 달성했으며 GPU와 텐스토렌트 칩을 결합한 이종 분산 서빙 구조로 텐스토렌트 칩을 prefill 전용 가속기로 활용해 HBM 사용을 줄이고 인프라 비용을 절감했다고 설명했습니다.

원문보기
feed://articles/related관련 기사
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증v.daum.net
2026. 5. 4. 오전 9:58

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoE모델분산서빙성능최적화추론가속비용절감
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증네이트
2026. 5. 4. 오전 9:57

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoE모델분산서빙성능최적화추론가속비용절감
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증전자신문
2026. 5. 4. 오후 4:12

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론갤럭시MoAI텐스토렌트이종가속기분산서빙HBMKV캐시
모레, 텐스토렌트 시스템의 LLM 추론 성능 입증…"GPU 중심 인프라 대체"AI타임스
2026. 5. 4. 오후 12:56

모레, 텐스토렌트 시스템의 LLM 추론 성능 입증…"GPU 중심 인프라 대체"

LLM추론GPU대체텐스토렌트MoE모델이종칩통합분산서빙HBM절감KV캐시
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능·안정성 확보데이터넷
2026. 5. 4. 오전 10:05

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능·안정성 확보

LLM추론텐스토렌트MoE모델분산서빙추론성능가속기HBM칩설계
“GPU 독점 흔드나”…모레, 캐나다 텐스토렌트와 LLM 추론 ‘DGX급 성능’ 입증이데일리
2026. 5. 4. 오후 12:06

“GPU 독점 흔드나”…모레, 캐나다 텐스토렌트와 LLM 추론 ‘DGX급 성능’ 입증

GPU독점LLM추론AI인프라이종분산MoE모델벤더독립성능최적화비용절감
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증아이뉴스24
2026. 5. 4. 오전 9:56

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoAI이종분산GPUNPU성능최적화
모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증네이트
2026. 5. 4. 오전 9:57

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론갤럭시텐스토렌트MoAI이종분산GPUNPU인프라
이슬림코리아·텐스토렌트, ‘AI EXPO KOREA 2026’서 차세대 AI 가속기 ‘블랙홀’ 국내 공개인공지능신문
2026. 5. 12. 오후 5:59

이슬림코리아·텐스토렌트, ‘AI EXPO KOREA 2026’서 차세대 AI 가속기 ‘블랙홀’ 국내 공개

AI가속기RISC-VLLM추론생성형AI서버시스템텐서처리비용절감프레임워크
"GPU 독점 흔드나"…모레, 캐나다 텐스토렌트와 LLM 추론 'DGX급 성능' 입증네이트
2026. 5. 4. 오후 12:08

"GPU 독점 흔드나"…모레, 캐나다 텐스토렌트와 LLM 추론 'DGX급 성능' 입증

GPU독점LLM추론AI가속기멀티벤더분산서빙추론프레임워크비용최적화이종칩통합
Shaking up the GPU dominance… Successfully proving 'DGX-class' Tensorrent-based LLM inference performance the day after tomorrow벤처스퀘어
2026. 5. 4. 오후 4:26

Shaking up the GPU dominance… Successfully proving 'DGX-class' Tensorrent-based LLM inference performance the day after tomorrow

LLM추론GPU대안MoE모델이종칩통합비용효율가속기데이터센터
시맨틱스 적용한 조직, 에이전틱 AI 정확도 최대 80% 향상 및 비용 최대 60% 절감인공지능신문
2026. 5. 12. 오후 8:22

시맨틱스 적용한 조직, 에이전틱 AI 정확도 최대 80% 향상 및 비용 최대 60% 절감

에이전틱AI시맨틱스정확도향상비용절감AI거버넌스데이터거버넌스컨텍스트신뢰성