article detail
KAIST "시간 오류 자동 진단…LLM 취약성 개선"
2026. 4. 14. 오전 8:15
AI 요약
KAIST 황의종 교수 연구팀과 마이크로소프트연구소가 시간 데이터베이스 설계 이론을 도입해 거대언어모델(LLM)의 시간 추론 능력을 자동으로 평가·진단하는 시스템을 개발했다고 14일 밝혔다. 이 시스템은 데이터베이스만으로 13가지 유형의 시간 기반 문제를 자동 생성하고 답변 과정에서 제시된 날짜·기간의 논리적 타당성까지 검증해 시간 환각을 평균 21.7% 더 정확하게 탐지한다고 연구팀은 설명했습니다. 또한 현실 정보가 변경되면 데이터베이스만 갱신하면 평가 문제와 정답이 자동 반영되어 유지보수 부담을 줄이고 입력 데이터양은 평균 51% 줄어들며, 연구 결과는 ICLR 2026에서 발표될 예정입니다.

![[개발] AI 시간 추론 능력, 자동으로 평가·진단한다](https://elec4.co.kr/media/commonfile/202604/14/f6c4d83c4e8ef0889dcd582ddd8cc401.jpg)


