IT뉴스모아news terminal

article detail

추론 강화했더니 허위 응답 폭증…딥시크-R1, V3 대비 환각률 4배 '껑충'

디지털투데이AI에이전트RAG강화학습검증딥시크암호화폐추론모델환각률
2026. 5. 12. 오전 9:47
추론 강화했더니 허위 응답 폭증…딥시크-R1, V3 대비 환각률 4배 '껑충'

AI 요약

중국 AI 스타트업 딥시크의 최신 추론 모델 '딥시크-R1'이 벡타라의 환각 평가 체계 HHEM 2.1에서 딥시크-V3(3.9%)보다 약 4배 높은 14.3%의 환각률을 기록했고, 벡타라는 이를 구글의 FACTS 방법론으로도 교차 검증했다고 11일(현지시간) 보도했습니다. 벡타라는 딥시크-R1이 원문에 없는 맥락이나 근거 없는 정보를 덧붙이는 '과도한 보완 성향'을 보였다고 지적했으며, 업계는 이러한 환각이 버추얼스 프로토콜, ai16z, AIXBT 등 AI 에이전트 기반 암호화폐 프로젝트에서 실제 온체인 오류와 금융 리스크로 이어질 수 있다고 우려합니다. 업계에서는 강화학습이 잘못된 정보를 단정적으로 생성하게 할 수 있다고 지적하는 한편, RAG·사후 검증 모델·미세조정 등으로 환각률을 낮출 수 있다고 보지만 현장에서는 여전히 환각 문제가 빈번해 검증 가능한 운영 구조가 핵심 과제로 제기되고 있습니다.

원문보기
feed://articles/related관련 기사
엠클라우드브리지, 기업 맞춤형 AI 에이전트 교육 프로그램 출시플래텀(Platum)
2026. 5. 12. 오후 1:38

엠클라우드브리지, 기업 맞춤형 AI 에이전트 교육 프로그램 출시

AI에이전트기업교육LMS마이크로소프트자동화프롬프트RAG생성형AI
서울시, 생성형 AI로 행정 혁신․․․ ‘챗봇 2.0’ 5월 가동한국AI부동산신문
2026. 5. 12. 오전 7:13

서울시, 생성형 AI로 행정 혁신․․․ ‘챗봇 2.0’ 5월 가동

생성형AI챗봇행정혁신LLM공무원업무시민상담RAGAI에이전트
서울시, 생성형 AI 행정 챗봇 2.0 가동…업무·시민상담 지원네이트
2026. 5. 11. 오전 11:15

서울시, 생성형 AI 행정 챗봇 2.0 가동…업무·시민상담 지원

생성형AI챗봇행정업무LLMRAG문서생성시민상담AI에이전트
디노티시아, “AI가 문서 읽고 판단까지”… 기업형 AI 에이전트 공개한국보험신문
2026. 5. 11. 오후 4:19

디노티시아, “AI가 문서 읽고 판단까지”… 기업형 AI 에이전트 공개

AI에이전트문서처리자연어검색RAG지식그래프금융기술클라우드플랫폼환각감소
서울시, 생성형 AI로 행정 혁신․․․ ‘챗봇 2.0’ 5월 가동세계환경신문
2026. 5. 11. 오후 3:47

서울시, 생성형 AI로 행정 혁신․․․ ‘챗봇 2.0’ 5월 가동

생성형AI챗봇행정혁신LLMRAGAI에이전트공무원업무시민상담
서울시, 생성형 AI로 행정 혁신··· ‘챗봇 2.0’ 5월 가동의정신문 서울시티
2026. 5. 11. 오후 1:34

서울시, 생성형 AI로 행정 혁신··· ‘챗봇 2.0’ 5월 가동

생성형AI챗봇행정혁신LLM공무원시민상담RAGAI에이전트
서울시, 자체 LLM 구축 완료…생성형 AI 기반 '챗봇 2.0' 가동전자신문
2026. 5. 11. 오후 1:22

서울시, 자체 LLM 구축 완료…생성형 AI 기반 '챗봇 2.0' 가동

생성형AILLM챗봇RAGAI에이전트행정자동화문서생성보안
서울시, 생성형 AI로 행정 혁신··· ‘챗봇 2.0’ 5월 가동한국방송뉴스
2026. 5. 11. 오후 12:11

서울시, 생성형 AI로 행정 혁신··· ‘챗봇 2.0’ 5월 가동

생성형AI챗봇행정혁신LLMRAGAI에이전트공공서비스자동화
인공지능, 서울시 공무원 업무 돕는다…AI에이전트 도입네이트
2026. 5. 11. 오전 11:15

인공지능, 서울시 공무원 업무 돕는다…AI에이전트 도입

인공지능챗봇LLMAI에이전트행정업무RAG자동화공공서비스
서울시, 생성형 AI 행정 챗봇 2.0 가동…업무·시민상담 지원연합뉴스
2026. 5. 11. 오전 11:15

서울시, 생성형 AI 행정 챗봇 2.0 가동…업무·시민상담 지원

생성형AI챗봇행정지원LLMRAGAI에이전트시민상담자동화
서울시 '챗봇 2.0' 가동⋯270종 행정업무에 AI 적용 확대이투데이
2026. 5. 11. 오전 11:15

서울시 '챗봇 2.0' 가동⋯270종 행정업무에 AI 적용 확대

챗봇생성형AI행정업무LLM보안RAGAI에이전트자동화
서울시, 생성형 AI 행정 챗봇 2.0 가동…업무·시민상담 지원네이트
2026. 5. 11. 오전 11:15

서울시, 생성형 AI 행정 챗봇 2.0 가동…업무·시민상담 지원

생성형AI챗봇행정업무LLMRAG자동화시민상담AI에이전트