IT뉴스모아news terminal

article detail

‘오늘 환율 묻자 1년전 정보’ AI 시간오류 개선

동아일보AI검증LLM시간데이터베이스시간오류시간환각언어모델평가시스템

2026. 4. 15. 오전 4:30

‘오늘 환율 묻자 1년전 정보’ AI 시간오류 개선

AI 요약

KAIST는 14일 황의종 전기및전자공학부 교수 연구팀이 마이크로소프트 리서치와 공동으로 대형언어모델(LLM)의 시간 오류를 자동으로 잡아내는 평가 시스템을 개발했다고 밝혔습니다. 연구팀은 정보가 시간에 따라 어떻게 바뀌는지를 기록하는 시간 데이터베이스 개념을 도입해 AI가 답변 과정에서 제시한 날짜와 기간까지 검증함으로써 겉으로는 정답처럼 보이지만 시간적 근거가 잘못된 시간 환각(Temporal Hallucination)을 기존 방식보다 평균 21.7% 더 정확하게 탐지했습니다. 황 교수는 방대한 전문 데이터를 평가 자원으로 전환함으로써 향후 의료, 법률 등 다양한 분야의 AI 성능 검증에 실질적인 기반이 될 것으로 기대한다고 말했습니다.

KAIST "시간 오류 자동 진단…LLM 취약성 개선"

2026. 4. 14. 오전 8:15

KAIST "시간 오류 자동 진단…LLM 취약성 개선"

LLM시간오류자동진단시간환각데이터베이스취약성평가시스템거대언어모델

KAIST "시간 오류 자동 진단…LLM 취약성 개선"

2026. 4. 14. 오전 8:15

KAIST "시간 오류 자동 진단…LLM 취약성 개선"

LLM시간추론자동진단시간환각데이터베이스취약성평가시스템논리검증

KAIST "시간 오류 자동 진단…LLM 취약성 개선"

2026. 4. 14. 오전 8:15

KAIST "시간 오류 자동 진단…LLM 취약성 개선"

LLM시간추론자동진단시간환각데이터베이스취약성검증언어모델

KAIST "시간 오류 자동 진단…LLM 취약성 개선"

아시아경제

2026. 4. 14. 오전 8:14

KAIST "시간 오류 자동 진단…LLM 취약성 개선"

LLM시간추론자동진단시간환각데이터베이스취약성평가시스템논리검증

IT 핫픽 - AI '시간 오류' 잡을까…해결 실마리 등장

2026. 4. 15. 오전 6:00

IT 핫픽 - AI '시간 오류' 잡을까…해결 실마리 등장

LLM시간이해평가시스템시간환각자동화데이터베이스오류탐지

[개발] AI 시간 추론 능력, 자동으로 평가·진단한다

2026. 4. 14. 오전 10:56

[개발] AI 시간 추론 능력, 자동으로 평가·진단한다

거대언어모델시간추론자동평가데이터베이스시간환각문제생성평가시스템LLM

KAIST "시간 오류 자동 진단…LLM 취약성 개선"

2026. 4. 14. 오전 8:15

KAIST "시간 오류 자동 진단…LLM 취약성 개선"

LLM시간추론자동진단시간환각데이터베이스평가시스템취약성검증

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증" — IT뉴스모아

news.dlwlrmaon.com

2026. 6. 3. 오후 6:03

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증" — IT뉴스모아

LLM벤치마크안전성다국어문화민감성오픈소스평가도구언어모델

"한국, AI 비싸게 쓴다"…한국어 토큰 소모, 영어 최대 2.59배 높아

2026. 6. 6. 오후 7:48

"한국, AI 비싸게 쓴다"…한국어 토큰 소모, 영어 최대 2.59배 높아

AILLM토큰한국어비용효율언어모델학습데이터토크나이저

앤서와이즈 AWAXIS-KR-31B-v5, 정부 운영 공개 LLM 평가서 1위 기록

2026. 6. 5. 오후 1:35

앤서와이즈 AWAXIS-KR-31B-v5, 정부 운영 공개 LLM 평가서 1위 기록

LLM한국어모델평가순위공개모델AI성능언어모델기술협력인공지능

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가AI안전언어모델

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가언어모델AI안전