article detail
더 크게보다 더 가볍게…AI 인프라 경량화 시대 부상
2026. 5. 16. 오전 10:39
AI 요약
생성형 AI가 로봇·모바일·자율주행·스마트팩토리·CCTV 등 산업 현장으로 확산되면서 AI 경쟁의 무게중심이 학습에서 추론으로 이동하고, 제한된 전력과 메모리 환경에서의 실행 효율과 지연시간·전력 효율이 핵심 경쟁력으로 부상하고 있습니다. 세레브라스 시스템즈는 나스닥 상장 첫날 공모가 대비 68% 급등했고 웨이퍼 스케일 칩과 고속 SRAM 등 추론 효율 기술이 주목받으며 맥킨지는 2030년 AI 컴퓨팅 수요의 절반 이상이 추론에서 발생할 것으로 전망했습니다. 이에 따라 퓨리오사AI·모빌린트·리벨리온 등 NPU 기반 반도체 기업과 노타(넷츠프레소)·스퀴즈비츠·아크릴 등 모델 경량화·추론 최적화 기술 기업들이 시장 공략을 강화하고 있습니다.

!["엣지 AI 시대, GPU보다 전력 효율 앞선 NPU가 주도할 것"[KIW 2026]](https://img.hankyung.com/photo/202605/01.44288740.1.jpg)


![[AI픽] SKT·Arm·리벨리온 AIDC 협력…추론 최적화 인프라 구축](https://img1.yna.co.kr/etc/inner/KR/2026/04/10/AKR20260410033300017_01_i_P4.jpg)
