IT뉴스모아news terminal

article detail

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

v.daum.netLLM추론MoE모델갤럭시분산서빙비용절감성능테스트추론가속텐스토렌트

2026. 5. 4. 오전 9:58

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

AI 요약

모레는 텐스토렌트의 갤럭시 웜홀 시스템에 자사 MoAI 추론 프레임워크를 적용해 LLM 추론 성능을 입증했다고 4일 밝혔습니다. GPT-OSS, Qwen, GLM, DeepSeek 등 최신 MoE 모델 기준 테스트에서 텐스토렌트 갤럭시 웜홀 시스템이 엔비디아 DGX A100급 또는 그 이상의 추론 성능을 달성했으며 GPU와 텐스토렌트 칩을 결합한 이종 분산 서빙 구조로 텐스토렌트 칩을 prefill 전용 가속기로 활용해 HBM 사용을 줄이고 인프라 비용을 절감했다고 설명했습니다.

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

2026. 5. 4. 오전 9:58

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoE모델분산서빙성능최적화추론가속비용절감

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

2026. 5. 4. 오전 9:57

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoE모델분산서빙성능최적화추론가속비용절감

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

2026. 5. 4. 오후 4:12

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론갤럭시MoAI텐스토렌트이종가속기분산서빙HBMKV캐시

모레, 텐스토렌트 시스템의 LLM 추론 성능 입증…"GPU 중심 인프라 대체"

2026. 5. 4. 오후 12:56

모레, 텐스토렌트 시스템의 LLM 추론 성능 입증…"GPU 중심 인프라 대체"

LLM추론GPU대체텐스토렌트MoE모델이종칩통합분산서빙HBM절감KV캐시

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능·안정성 확보

2026. 5. 4. 오전 10:05

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능·안정성 확보

LLM추론텐스토렌트MoE모델분산서빙추론성능가속기HBM칩설계

“GPU 독점 흔드나”…모레, 캐나다 텐스토렌트와 LLM 추론 ‘DGX급 성능’ 입증

2026. 5. 4. 오후 12:06

“GPU 독점 흔드나”…모레, 캐나다 텐스토렌트와 LLM 추론 ‘DGX급 성능’ 입증

GPU독점LLM추론AI인프라이종분산MoE모델벤더독립성능최적화비용절감

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

2026. 5. 4. 오전 9:56

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoAI이종분산GPUNPU성능최적화

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

2026. 5. 4. 오전 9:57

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론갤럭시텐스토렌트MoAI이종분산GPUNPU인프라

이슬림코리아·텐스토렌트, ‘AI EXPO KOREA 2026’서 차세대 AI 가속기 ‘블랙홀’ 국내 공개

인공지능신문

2026. 5. 12. 오후 5:59

이슬림코리아·텐스토렌트, ‘AI EXPO KOREA 2026’서 차세대 AI 가속기 ‘블랙홀’ 국내 공개

AI가속기RISC-VLLM추론생성형AI서버시스템텐서처리비용절감프레임워크

"GPU 독점 흔드나"…모레, 캐나다 텐스토렌트와 LLM 추론 'DGX급 성능' 입증

2026. 5. 4. 오후 12:08

"GPU 독점 흔드나"…모레, 캐나다 텐스토렌트와 LLM 추론 'DGX급 성능' 입증

GPU독점LLM추론AI가속기멀티벤더분산서빙추론프레임워크비용최적화이종칩통합

Shaking up the GPU dominance… Successfully proving 'DGX-class' Tensorrent-based LLM inference performance the day after tomorrow

벤처스퀘어

2026. 5. 4. 오후 4:26

Shaking up the GPU dominance… Successfully proving 'DGX-class' Tensorrent-based LLM inference performance the day after tomorrow

LLM추론GPU대안MoE모델이종칩통합비용효율가속기데이터센터

빅테크 AI ‘쩐의 전쟁’ 확산… 메타, 투자 재원 위해 주식 공모 검토

2026. 6. 7. 오전 11:15

빅테크 AI ‘쩐의 전쟁’ 확산… 메타, 투자 재원 위해 주식 공모 검토

AI인프라주식공모자본지출데이터센터LLM웨어러블자금조달비용절감