article detail
"2030년까지 LLM 추론비용 90%↓…그럼에도 기업 비용부담은 지속"
2026. 3. 30. 오전 11:03
AI 요약
가트너는 2030년까지 1조개(1000B) 파라미터 LLM의 추론 비용이 2025년 대비 90% 이상 낮아지고, 2022년 생성형 AI 초기 대비 최대 100배 비용 효율성이 개선될 것으로 전망했습니다. 다만 AI 에이전트처럼 고도화된 기능은 기존 챗봇보다 작업당 5~30배 많은 토큰을 요구해, 토큰 단가 하락보다 사용량 증가가 더 빨라 기업의 전체 추론 비용 부담은 계속될 수 있다고 봤습니다. 가트너는 반복·고빈도 업무는 소형모델·도메인 특화모델로 처리하고, 비용이 높은 프런티어급 모델은 고부가가치의 복잡한 추론 작업에 선택적으로 활용할 것을 권고했습니다.

![[AI픽] LGU+·IBK시스템, 금융 특화 AI 에이전트 개발 맞손](https://img0.yna.co.kr/etc/inner/KR/2026/04/07/AKR20260407024000017_01_i_P4.jpg)






