article detail
KAIST "시간 오류 자동 진단…LLM 취약성 개선"
2026. 4. 14. 오전 8:15
AI 요약
KAIST는 전기 및 전자공학부 황의종 교수 연구팀과 마이크로소프트연구소가 시간 데이터베이스 기술로 거대언어모델(LLM)의 시간 추론 능력을 자동으로 평가·진단하는 시스템을 개발했다고 14일 밝혔습니다. 연구팀은 시간 데이터베이스를 도입해 사람이 직접 문제를 작성하지 않고 데이터만으로 13가지 유형의 시간 기반 문제가 자동 생성되며 정답 도출과 검증까지 자동화되어 현실 정보가 바뀌면 데이터베이스만 갱신하면 평가 문제와 정답, 검증 기준이 자동으로 반영된다고 설명했습니다. 이 시스템은 답변 과정에서 제시된 날짜·기간의 논리성까지 검증하는 지표를 도입해 시간 환각을 평균 21.7% 더 정확히 탐지하고 평가 유지비용을 낮추며 입력 데이터량을 평균 51% 줄이는 효과가 있다고 공동연구팀은 밝혔고, 연구 결과는 ICLR 2026에서 발표될 예정입니다.


![[개발] AI 시간 추론 능력, 자동으로 평가·진단한다](https://elec4.co.kr/media/commonfile/202604/14/f6c4d83c4e8ef0889dcd582ddd8cc401.jpg)

