article detail
AI 능력에도 ‘우상향 그래프’ 확산…평가 기준 논쟁
2026. 4. 26. 오전 5:00

AI 요약
25일(현지시각) 블룸버그통신에 따르면 인공지능 성능이 빠르게 향상되면서 이를 나타내는 우상향 그래프가 확산되고 있고 투자자들은 기업 실적뿐 아니라 AI 성능 지표까지 기업 가치 평가에 참고하고 있습니다. 비영리 연구단체 모델 평가 및 위협 연구(METR)는 AI가 인간 개입 없이 장시간 복잡한 과제를 수행할 수 있는 능력을 핵심 지표로 삼고 있습니다. 다만 성능을 수치로 환산하는 방식은 평가 조건에 따라 결과가 달라지고 실제 환경에서 재현 가능성에 대한 검증이 필요하다는 논쟁이 커지고 있으며, AI 경쟁 심화로 이러한 지표는 기업 전략과 투자 판단에 직접적인 영향을 미쳐 시장 기대와 자금 흐름을 동시에 움직이는 핵심 변수로 자리 잡고 있습니다.





![[4월24일] "GPT-5.5가 더 정직해서 클로드 4.7를 이겼다?"...'벤딩벤치'가 보여준 전략의 차이](https://cdn.aitimes.com/news/photo/202604/209711_212168_4652.png)