article detail
가트너 “2030년 LLM 추론 비용 90% 하락…기업 부담은 지속”
2026. 3. 30. 오후 3:07

AI 요약
가트너는 30일, 2030년까지 1조 파라미터 규모 LLM의 추론 비용이 2025년 대비 90% 이상 하락하고 2022년 초기 동일 규모 모델 대비 비용 효율성은 최대 100배 개선될 것으로 전망했습니다. 다만 AI 고도화로 토큰 수요가 급증해, 예를 들어 AI 에이전트는 기존 챗봇보다 작업당 5~30배 많은 토큰을 사용하므로 토큰 단가 하락에도 전체 추론 비용은 오히려 증가할 수 있다고 분석했습니다. 가트너는 반복·고빈도 업무는 sLLM이나 도메인 특화 모델로 처리하고 프론티어급 모델은 복잡한 고수익 추론에 선택적으로 활용하는 워크로드 오케스트레이션 역량이 미래 AI 경쟁력의 핵심이라고 제시했습니다.






