article detail
“AI에 내 증상 묻지 마세요” 답변 절반은 거짓말?
2026. 4. 16. 오후 12:09

AI 요약
UCLA대·앨버타대·오타와대 공동연구팀이 구글 제미나이, 오픈AI 챗GPT, 메타AI, 그록, 딥시크 등 인기 챗봇 5종에 암·백신·줄기세포·영양·운동 분야별로 10개씩 총 50개 질문을 던져 생성된 250개의 답변을 전문가 2인이 분석한 결과 전체의 49.6%(124개)가 거짓 정보를 포함했고 이 중 49개는 임상적으로 심각한 오류 수준이었습니다. 영양·운동과 줄기세포 등 생활밀착형·비표준화 영역과 개방형 질문에서 오류가 더 많았고 모델별 유의미한 정확도 차이는 없었으나 그록의 오류 비율이 가장 높았습니다. AI는 근거 제시 요구에 80%에서 논문을 제시했으나 절반 이상이 존재하지 않는 가짜 논문이었고 작동하지 않는 링크가 많았으며 답변 거부는 250개 중 2개(0.8%)에 불과해 대부분 확신에 찬 단정적 표현으로 답변했고 해당 연구는 BMJ 오픈에 게재되었습니다.

![[경제와 세상] ‘착한 AI’ 생태계 구축, 대한민국의 새로운 생존 전략이다](https://www.yeongnam.com/mnt/file/202604/news-p.v1.20251127.2011e8637b454c75b01fce891caf4b0a_R.jpg)

