article detail
"2030년까지 LLM 추론비용 90%↓…그럼에도 기업 비용부담은 지속"
2026. 3. 30. 오전 11:03
AI 요약
가트너는 2030년까지 1조개(1000B) 파라미터 LLM의 추론 비용이 2025년 대비 90% 이상 감소하고, 2022년 초기 생성형 AI 대비 최대 100배 비용 효율 개선이 가능하다고 전망했습니다. 다만 AI 에이전트처럼 고도화 기능이 작업당 5~30배 더 많은 토큰을 요구해 토큰 단가 하락보다 사용량 증가가 더 빨라, 기업의 전체 AI 추론 비용 부담은 계속될 수 있다고 봤습니다. 이에 가트너는 반복·고빈도 업무는 소형·도메인 특화 모델로 처리하고, 비용이 높은 프런티어급 모델은 고부가가치 복잡 추론에 선택적으로 쓰는 방식의 워크로드 오케스트레이션이 필요하다고 제시했습니다.








