article detail
2030년 LLM 추론 비용 90% 감소…"그래도 AI 총비용은 오른다"
2026. 3. 30. 오전 8:54
AI 요약
가트너는 2030년까지 1조 개 파라미터 규모 LLM의 추론 비용이 2025년 대비 90% 이상 낮아지고, 2022년 초기 동일 규모 모델 대비 비용 효율성은 최대 100배 개선될 것으로 전망했습니다. 이 전망은 최첨단 반도체를 쓰는 프런티어 시나리오와 기존 반도체를 혼합하는 레거시 혼합 시나리오를 기반으로 하며, 레거시 혼합은 연산 성능이 낮아 비용이 더 높게 나타났습니다. 다만 가트너는 AI 에이전트가 기존 챗봇보다 작업당 5~30배 많은 토큰을 써 토큰 단가 하락만으로 기업 AI 비용이 줄지 않을 수 있다고 보고, 반복 업무는 소형·도메인 특화 모델로 처리하고 프런티어급 모델은 고부가가치 복잡 추론에 선택적으로 쓰라고 권고했습니다.








