article detail
[개발] AI 시간 추론 능력, 자동으로 평가·진단한다
2026. 4. 14. 오전 10:56
![[개발] AI 시간 추론 능력, 자동으로 평가·진단한다](https://elec4.co.kr/media/commonfile/202604/14/f6c4d83c4e8ef0889dcd582ddd8cc401.jpg)
AI 요약
KAIST 전기및전자공학부 황의종 교수 연구팀이 마이크로소프트연구소와 공동연구를 통해 시간 데이터베이스 이론을 인공지능 평가에 도입해 거대언어모델(LLM)의 시간 추론 능력을 자동으로 평가·진단하는 시스템을 개발했다고 4월 14일 밝혔습니다. 연구팀은 데이터의 시간적 흐름과 관계 구조를 활용해 사람이 문제를 일일이 작성하지 않아도 데이터베이스만으로 13가지 유형의 복잡한 시간 기반 문제를 자동 생성하고 문제 생성부터 정답 도출·검증까지 전 과정을 자동화해 시간 환각을 평균 21.7% 더 정확히 탐지했으며 평가 데이터 구축 비용을 평균 51% 절감했다고 설명했습니다. 이 연구는 KAIST 김소연 박사과정이 제1저자로 참여했으며 마이크로소프트연구소의 연구원들이 공동 저자로 참여했고 연구 결과는 ICLR 2026에서 발표될 예정입니다.




