article detail
추론 강화했더니 허위 응답 폭증…딥시크-R1, V3 대비 환각률 4배 '껑충'
2026. 5. 12. 오전 9:47

AI 요약
중국 AI 스타트업 딥시크의 최신 추론 모델 '딥시크-R1'이 벡타라의 환각 평가 체계 HHEM 2.1에서 딥시크-V3(3.9%)보다 약 4배 높은 14.3%의 환각률을 기록했고, 벡타라는 이를 구글의 FACTS 방법론으로도 교차 검증했다고 11일(현지시간) 보도했습니다. 벡타라는 딥시크-R1이 원문에 없는 맥락이나 근거 없는 정보를 덧붙이는 '과도한 보완 성향'을 보였다고 지적했으며, 업계는 이러한 환각이 버추얼스 프로토콜, ai16z, AIXBT 등 AI 에이전트 기반 암호화폐 프로젝트에서 실제 온체인 오류와 금융 리스크로 이어질 수 있다고 우려합니다. 업계에서는 강화학습이 잘못된 정보를 단정적으로 생성하게 할 수 있다고 지적하는 한편, RAG·사후 검증 모델·미세조정 등으로 환각률을 낮출 수 있다고 보지만 현장에서는 여전히 환각 문제가 빈번해 검증 가능한 운영 구조가 핵심 과제로 제기되고 있습니다.








