article detail
[딜라이트닷넷] “가볍고 빠르게”… 글로벌 AI 빅테크, 경량화 모델 전쟁 2차전 돌입
2026. 4. 15. 오후 4:06
![[딜라이트닷넷] “가볍고 빠르게”… 글로벌 AI 빅테크, 경량화 모델 전쟁 2차전 돌입](https://www.ddaily.co.kr/photos/2026/04/15/2026041515210633189_l.png)
AI 요약
무겁고 비싼 대형언어모델(LLM) 대신 필요한 성능을 유지하면서 크기와 비용을 줄인 소형언어모델(SLM) 경쟁이 다시 가열되고 있으며, 업계는 GPU 공급 부족과 피지컬AI의 엣지 디바이스 수요로 경량화 모델 중요성이 커지고 있다고 15일 전했습니다. 오픈AI는 지난달 GPT‑5.4 미니·나노를 공개해 입력 토큰 100만개당 0.75달러(미니)·0.20달러(나노), 출력 토큰 100만개당 4.50달러·1.25달러의 비용을 제시했고, 구글은 아파치 2.0 라이선스의 젬마4 시리즈(엣지용 E2B부터 전문가용 31B까지, 소형 E4B는 네이티브 오디오·비전 처리 지원)를 공개했으며, 앤트로픽은 클로드 4.5 하이쿠와 소넷 4.5의 복합 사용법과 함께 입력 100만개당 1달러·출력 100만개당 5달러의 요금을 내세웠습니다. 전문가들은 이번 경량화 경쟁이 AI 산업의 수익 구조를 근본적으로 바꾸고 시장 경쟁이 지연시간과 비용 중심으로 전환되고 있다고 보고 있습니다.


![[양현상 칼럼] AI 반도체 패권의 진짜 승부처](https://cdn.aitimes.com/news/photo/202605/210090_212656_1234.jpg)


