article detail
KAIST "시간 오류 자동 진단…LLM 취약성 개선"
2026. 4. 14. 오전 8:15
AI 요약
KAIST 황의종 교수 연구팀과 마이크로소프트연구소(Microsoft Research)가 시간 데이터베이스 설계 이론을 도입해 거대언어모델(LLM)의 시간 추론 능력을 자동으로 평가·진단하는 시스템을 개발했다고 14일 밝혔습니다. 이 시스템은 데이터만으로 13가지 유형의 시간 기반 문제를 자동 생성하고 답변 과정에서 제시된 날짜·기간의 논리적 타당성까지 검증해 시간 환각을 기존보다 평균 21.7% 더 정확하게 탐지하며 입력 데이터양을 평균 51% 줄인다고 연구팀은 설명했습니다. 연구에는 KAIST 김소연 박사과정이 제1저자로 참여했고 진동 왕, 싱 시에 연구원이 공동저자로 참여했으며 연구 결과는 ICLR 2026에서 발표될 예정입니다.


![[개발] AI 시간 추론 능력, 자동으로 평가·진단한다](https://elec4.co.kr/media/commonfile/202604/14/f6c4d83c4e8ef0889dcd582ddd8cc401.jpg)
