article detail
LLM 추론 단가 90% 하락 전망에도...가트너 '사용량 증가로 부담 늘 것'
2026. 3. 30. 오전 11:57
AI 요약
가트너는 30일, 2030년까지 1조개(1000B) 파라미터 LLM의 추론 비용이 2025년 대비 90% 이상 감소하고, 2022년 초기 대비 동일 규모 모델의 비용 효율성은 최대 100배 개선될 것으로 전망했습니다. 이는 반도체·인프라 효율화, 모델 설계 혁신, 칩 활용도 증가, 추론 특화 반도체 확대, 엣지 디바이스 적용 확대 등에 따른 것이며, 프런티어 시나리오보다 레거시 혼합 시나리오의 비용이 더 높은 것으로 분석됐습니다. 다만 가트너는 토큰 단가 하락에도 고도화된 AI 기능과 AI에이전트의 높은 토큰 수요(기존 챗봇 대비 작업당 5~30배)로 전체 추론 비용은 오히려 증가할 수 있어, 소형·도메인 특화 모델과 프런티어급 모델을 용도별로 오케스트레이션해야 한다고 제언했습니다.






![[K-AI 이노베이터] 데이터·검색·금융·보안·법률까지…韓 AI 혁신 기업 한 자리에](https://image.inews24.com/v1/41be7e6be9319c.jpg)
