IT뉴스모아news terminal

article detail

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

네이트LLM추론MoE모델갤럭시분산서빙비용절감성능최적화추론가속텐스토렌트

2026. 5. 4. 오전 9:57

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

AI 요약

모레는 텐스토렌트의 갤럭시 웜홀 시스템에 자사 MoAI 추론 프레임워크를 적용해 5월 1일(현지 시각) 미국 샌프란시스코에서 열린 텐스토렌트 신제품 발표 행사(TT-Deploy)에서 LLM 추론 성능을 입증했다고 4일 밝혔습니다. GPT-OSS, Qwen, GLM, DeepSeek 등 최신 MoE 모델 기준 테스트에서 텐스토렌트 갤럭시 웜홀이 엔비디아 DGX A100급 또는 그 이상의 LLM 추론 성능을 달성했다고 밝혔습니다. 모레는 GPU와 텐스토렌트 웜홀 칩을 결합한 이종 분산 서빙 구조에서 텐스토렌트 칩을 prefill 전용 가속기로 활용해 HBM 사용을 줄이고 전체 인프라 비용을 절감했다고 설명했습니다.

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

2026. 5. 4. 오전 9:58

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoE모델분산서빙성능최적화추론가속비용절감

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

2026. 5. 4. 오전 9:58

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoE모델분산서빙성능테스트추론가속비용절감

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

2026. 5. 4. 오후 4:12

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론갤럭시MoAI텐스토렌트이종가속기분산서빙HBMKV캐시

모레, 텐스토렌트 시스템의 LLM 추론 성능 입증…"GPU 중심 인프라 대체"

2026. 5. 4. 오후 12:56

모레, 텐스토렌트 시스템의 LLM 추론 성능 입증…"GPU 중심 인프라 대체"

LLM추론GPU대체텐스토렌트MoE모델이종칩통합분산서빙HBM절감KV캐시

“GPU 독점 흔드나”…모레, 캐나다 텐스토렌트와 LLM 추론 ‘DGX급 성능’ 입증

2026. 5. 4. 오후 12:06

“GPU 독점 흔드나”…모레, 캐나다 텐스토렌트와 LLM 추론 ‘DGX급 성능’ 입증

GPU독점LLM추론AI인프라이종분산MoE모델벤더독립성능최적화비용절감

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

2026. 5. 4. 오전 9:56

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론텐스토렌트갤럭시MoAI이종분산GPUNPU성능최적화

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능·안정성 확보

2026. 5. 4. 오전 10:05

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능·안정성 확보

LLM추론텐스토렌트MoE모델분산서빙추론성능가속기HBM칩설계

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

2026. 5. 4. 오전 9:57

모레, 텐스토렌트 갤럭시 기반 LLM 추론 성능 입증

LLM추론갤럭시텐스토렌트MoAI이종분산GPUNPU인프라

AI 모델부터 영상까지…구글, 오픈AI·앤트로픽 겨냥 전방위 공세

2026. 5. 20. 오전 7:21

AI 모델부터 영상까지…구글, 오픈AI·앤트로픽 겨냥 전방위 공세

AI모델멀티모달성능최적화비용절감보안취약점코드분석개발자도구영상생성

AI모델·보안·영상…구글, 오픈AI·앤트로픽 조준 전방위 공세

2026. 5. 20. 오전 3:38

AI모델·보안·영상…구글, 오픈AI·앤트로픽 조준 전방위 공세

AI모델다중양식성능최적화보안에이전트취약점탐지개발자도구비용절감영상처리

이슬림코리아·텐스토렌트, ‘AI EXPO KOREA 2026’서 차세대 AI 가속기 ‘블랙홀’ 국내 공개

인공지능신문

2026. 5. 12. 오후 5:59

이슬림코리아·텐스토렌트, ‘AI EXPO KOREA 2026’서 차세대 AI 가속기 ‘블랙홀’ 국내 공개

AI가속기RISC-VLLM추론생성형AI서버시스템텐서처리비용절감프레임워크

"GPU 독점 흔드나"…모레, 캐나다 텐스토렌트와 LLM 추론 'DGX급 성능' 입증

2026. 5. 4. 오후 12:08

"GPU 독점 흔드나"…모레, 캐나다 텐스토렌트와 LLM 추론 'DGX급 성능' 입증

GPU독점LLM추론AI가속기멀티벤더분산서빙추론프레임워크비용최적화이종칩통합