IT뉴스모아news terminal

article detail

KAIST, LLM 서버 구축 전 성능 검증하는 ‘가상 AI 실험장’ 개발

스포트라이트유AI인프라GPULLM메모리최적화성능검증시뮬레이터이종하드웨어전력효율

2026. 6. 4. 오후 4:29

KAIST, LLM 서버 구축 전 성능 검증하는 ‘가상 AI 실험장’ 개발

AI 요약

KAIST 전산학부 박종세 교수 연구팀이 대규모 AI 서버를 실제로 구축하지 않고도 성능과 효율을 검증할 수 있는 거대언어모델 서비스 인프라 시뮬레이터 LLMServingSim 2.0을 개발해 ISPASS 2026에서 최우수 논문상을 수상했다고 29일 밝혔습니다. LLMServingSim 2.0은 GPU, TPU, NPU, PIM, CXL 기반 메모리 등 다양한 이종 하드웨어와 분리형 인프라를 통합된 런타임 구조에서 모델링해 배치 스케줄링, 메모리 이동·재사용, 전력 모델 등 서비스 운영의 복잡한 동작을 재현하고 속도·전력·메모리 사용량·처리량 등을 가상으로 분석할 수 있습니다. 연구팀은 vLLM 기반 GPU 및 TPU 서빙 시스템과의 비교 검증에서 평균 0.95% 수준의 오차와 실용적 시뮬레이션 시간을 달성했으며, LLMServingSim 2.0을 공개하고 다양한 하드웨어 프로파일을 추가해 연구자와 기업이 차세대 AI 인프라를 실제 구축 전에 빠르고 저비용으로 검증할 수 있도록 발전시킬 계획입니다.

“AI 서버 구축 전 미리 성능 검증”…KAIST, LLM 인프라 시뮬레이터 개발

2026. 5. 31. 오후 8:56

“AI 서버 구축 전 미리 성능 검증”…KAIST, LLM 인프라 시뮬레이터 개발

LLM시뮬레이터AI서버성능검증이종하드웨어서빙최적화오픈소스GPU

‘대형 AI서버’ 성능·효율 사전 검증…KAIST, ‘가상 AI 실험장’ 개발

2026. 5. 29. 오전 8:26

‘대형 AI서버’ 성능·효율 사전 검증…KAIST, ‘가상 AI 실험장’ 개발

AI서버시뮬레이터LLMGPUNPU성능검증AI인프라반도체

수만 대 AI 서버 없이도 성능 검증···KAIST, 가상 실험장 개발

2026. 5. 31. 오후 4:50

수만 대 AI 서버 없이도 성능 검증···KAIST, 가상 실험장 개발

AI반도체LLM시뮬레이터성능검증GPUNPU메모리확장하드웨어평가

'대형 AI서버' 성능·효율 사전 검증…KAIST, '가상 AI 실험장' 개발

2026. 5. 29. 오전 8:26

'대형 AI서버' 성능·효율 사전 검증…KAIST, '가상 AI 실험장' 개발

AI서버시뮬레이터성능검증GPUNPUPIM분산인프라메모리최적화

KAIST, 거대한 AI서버 구축 전 성능 검증 가능한‘가상 AI 실험장’개발

2026. 5. 29. 오전 7:49

KAIST, 거대한 AI서버 구축 전 성능 검증 가능한‘가상 AI 실험장’개발

AI서버LLM시뮬레이션성능검증GPUNPU분산인프라전력효율

네이버-엔비디아, AI 인프라 깐부 맺는다…기가와트급 AI 팩토리 구축(종합)

아시아경제

2026. 6. 8. 오전 10:51

네이버-엔비디아, AI 인프라 깐부 맺는다…기가와트급 AI 팩토리 구축(종합)

AI인프라데이터센터LLM거대언어모델소버린AI피지컬AI오픈모델GPU

서버 한 대가 수백 대 전력 삼킨다…LG유플러스 파주 ‘AI 공장’ 가보니

2026. 6. 7. 오후 4:07

서버 한 대가 수백 대 전력 삼킨다…LG유플러스 파주 ‘AI 공장’ 가보니

데이터센터AI인프라GPU액체냉각전력효율클라우드AI서비스하이브리드냉각

[AI 고속도로] "GPU 의존 낮춘다"…AWS 자체 칩 생태계, 핀터레스트 합류로 탄력 — IT뉴스모아

news.dlwlrmaon.com

2026. 6. 4. 오후 7:38

[AI 고속도로] "GPU 의존 낮춘다"…AWS 자체 칩 생태계, 핀터레스트 합류로 탄력 — IT뉴스모아

AWS칩자체칩클라우드AI인프라GPU트레이니움그래비톤LLM

노타, GPU·NPU 동시 활용 AI 추론 구현…"AI PC 전력효율 개선"

2026. 6. 4. 오전 8:46

노타, GPU·NPU 동시 활용 AI 추론 구현…"AI PC 전력효율 개선"

AIPCGPUNPULLM추론이기종컴퓨팅전력효율온디바이스AI

젠슨 황 '하트 시그널'…네이버와 그리는 세 가지 청사진

2026. 6. 3. 오전 7:12

젠슨 황 '하트 시그널'…네이버와 그리는 세 가지 청사진

AI인프라GPULLM클라우드협력AI모델피지컬AI월드모델

'가상 실험장'서 AI 반도체·LLM 검증…"시간·비용 절감"

2026. 5. 29. 오전 8:36

'가상 실험장'서 AI 반도체·LLM 검증…"시간·비용 절감"

AI반도체LLM시뮬레이션GPUNPUPIM성능검증분산시스템

'가상 실험장'서 AI 반도체·LLM 검증…"시간·비용 절감"

아시아경제

2026. 5. 29. 오전 8:34

'가상 실험장'서 AI 반도체·LLM 검증…"시간·비용 절감"

AI반도체시뮬레이션LLMGPUNPUPIM성능검증데이터센터