article detail
2030년까지 LLM 추론 비용 90% 이상 하락, 기업 비용 부담은 지속
2026. 3. 31. 오전 5:50
AI 요약
가트너는 2030년까지 1조 개 파라미터 LLM의 추론 비용이 2025년 대비 90% 이상 하락하고, 2022년 초기 동일 규모 모델 대비 최대 100배의 비용 효율성 개선이 가능하다고 전망했습니다. 이는 반도체·인프라 효율 개선, 모델 설계 혁신, 추론 특화 반도체 확대, 엣지 디바이스 적용 확대를 전제로 한 분석이며, 프런티어와 레거시 혼합 시나리오 중 레거시 혼합이 더 높은 비용을 보인다고 밝혔습니다. 다만 AI 에이전트처럼 작업당 토큰 사용량이 기존 챗봇 대비 최소 5배에서 최대 30배까지 늘어날 수 있어 토큰 단가 하락이 기업 총추론비 절감으로 직결되지는 않으며, 가트너는 멀티 모델 오케스트레이션과 고가 프런티어 모델의 선택적 활용이 중요하다고 제시했습니다.







![[테크인사이드] 아직 돈 먹는 하마...오픈AI·앤트로픽 IPO 앞 'AI 경제학'](https://cdn.digitaltoday.co.kr/news/photo/202604/654133_603895_3349.jpg)
