IT뉴스모아news terminal

article detail

KAIST "시간 오류 자동 진단…LLM 취약성 개선"

v.daum.netLLM논리검증데이터베이스시간추론시간환각자동진단취약성평가시스템

2026. 4. 14. 오전 8:15

KAIST "시간 오류 자동 진단…LLM 취약성 개선"

AI 요약

KAIST 황의종 교수 연구팀과 마이크로소프트연구소가 시간 데이터베이스 설계 이론을 도입해 거대언어모델(LLM)의 시간 추론 능력을 자동으로 평가·진단하는 시스템을 개발했다고 14일 밝혔다. 이 시스템은 데이터베이스만으로 13가지 유형의 시간 기반 문제를 자동 생성하고 답변 과정에서 제시된 날짜·기간의 논리적 타당성까지 검증해 시간 환각을 평균 21.7% 더 정확하게 탐지한다고 연구팀은 설명했습니다. 또한 현실 정보가 변경되면 데이터베이스만 갱신하면 평가 문제와 정답이 자동 반영되어 유지보수 부담을 줄이고 입력 데이터양은 평균 51% 줄어들며, 연구 결과는 ICLR 2026에서 발표될 예정입니다.

KAIST "시간 오류 자동 진단…LLM 취약성 개선"

아시아경제

2026. 4. 14. 오전 8:14

KAIST "시간 오류 자동 진단…LLM 취약성 개선"

LLM시간추론자동진단시간환각데이터베이스취약성평가시스템논리검증

KAIST "시간 오류 자동 진단…LLM 취약성 개선"

2026. 4. 14. 오전 8:15

KAIST "시간 오류 자동 진단…LLM 취약성 개선"

LLM시간추론자동진단시간환각데이터베이스평가시스템취약성검증

KAIST "시간 오류 자동 진단…LLM 취약성 개선"

2026. 4. 14. 오전 8:15

KAIST "시간 오류 자동 진단…LLM 취약성 개선"

LLM시간추론자동진단시간환각데이터베이스취약성검증언어모델

KAIST "시간 오류 자동 진단…LLM 취약성 개선"

2026. 4. 14. 오전 8:15

KAIST "시간 오류 자동 진단…LLM 취약성 개선"

LLM시간오류자동진단시간환각데이터베이스취약성평가시스템거대언어모델

카이스트·MS연구소 'AI의 시간 오류 진단' 시스템 공동 개발

2026. 4. 14. 오후 4:01

카이스트·MS연구소 'AI의 시간 오류 진단' 시스템 공동 개발

AI평가시간추론LLM시간환각자동진단데이터베이스문제생성거대언어모델

[개발] AI 시간 추론 능력, 자동으로 평가·진단한다

2026. 4. 14. 오전 10:56

[개발] AI 시간 추론 능력, 자동으로 평가·진단한다

거대언어모델시간추론자동평가데이터베이스시간환각문제생성평가시스템LLM

KAIST "시간 오류 자동 진단…LLM 취약성 개선"

2026. 4. 14. 오전 8:15

KAIST "시간 오류 자동 진단…LLM 취약성 개선"

LLM시간추론자동진단시간환각데이터베이스취약성평가자동생성검증시스템

IT 핫픽 - AI '시간 오류' 잡을까…해결 실마리 등장

2026. 4. 15. 오전 6:00

IT 핫픽 - AI '시간 오류' 잡을까…해결 실마리 등장

LLM시간이해평가시스템시간환각자동화데이터베이스오류탐지

KAIST, LLM ‘시간 추론 오류’ 평가 기술 개발… 검출력 21.7% 향상

스포트라이트유

2026. 4. 14. 오후 11:10

KAIST, LLM ‘시간 추론 오류’ 평가 기술 개발… 검출력 21.7% 향상

LLM시간추론평가기술시간환각데이터베이스자동생성검증AI

AI 의료·법률 분야 신뢰성 높인다…'시간 환각' 자동 진단 체계 개발

2026. 4. 14. 오후 3:29

AI 의료·법률 분야 신뢰성 높인다…'시간 환각' 자동 진단 체계 개발

LLM시간추론환각탐지의료AI법률AI자동진단데이터베이스신뢰성

KAIST, ‘챗GPT 시간 오류 바로잡아’

서울뉴스통신

2026. 4. 14. 오후 1:39

KAIST, ‘챗GPT 시간 오류 바로잡아’

거대언어모델시간추론데이터베이스평가진단시간환각자동생성검증지표LLM

KAIST, 챗GPT 시간 오류 바로잡는다… AI 정확성 한단계 높여

2026. 4. 14. 오후 1:27

KAIST, 챗GPT 시간 오류 바로잡는다… AI 정확성 한단계 높여

거대언어모델시간추론시간환각평가시스템데이터베이스AI정확성자동화검증지표