IT뉴스모아news terminal

article detail

환각 가장 많은 AI 모델은?…구글 제미나이, 환각률 32%로 1위

디지털투데이AI챗봇가동률만족도벤치마크성능비교응답일관성허위정보환각률
2026. 4. 25. 오후 9:12
환각 가장 많은 AI 모델은?…구글 제미나이, 환각률 32%로 1위

AI 요약

24일(현지시간) IT전문매체 폰아레나에 따르면 리걸 가디언 디지털은 인기 AI 챗봇의 허위 정보 응답 비율, 이용자 만족도, 서비스 가동률 등을 0~100점 지수로 비교한 조사에서 제미나이가 환각률 32%로 가장 높고 챗GPT는 30%였으며 퍼플렉시티 AI는 오답 비율 13%로 가장 낮았다고 발표했습니다. 종합 지수에서는 퍼플렉시티 AI가 85점으로 1위를 차지했고 그록이 79점, 딥시크가 뒤를 이었으며 챗GPT는 50점으로 6위, 제미나이는 41점으로 8위였고 메타 AI는 37점으로 최하위였습니다. 이용자 만족도는 딥시크와 챗GPT가 5점 만점에 4.7점으로 공동 1위였고 응답 일관성은 키미 AI가 4.3점으로 가장 높았으며 서비스 가동률은 퍼플렉시티 AI와 그록만 조사 기간 내내 중단 없이 운영됐고 챗GPT는 99.98%, 제미나이는 99.95%, 앤트로픽의 클로드는 99.68%로 가장 낮았습니다.

원문보기
feed://articles/related관련 기사
[4월24일] "GPT-5.5가 더 정직해서 클로드 4.7를 이겼다?"...'벤딩벤치'가 보여준 전략의 차이AI타임스
2026. 4. 25. 오전 7:00

[4월24일] "GPT-5.5가 더 정직해서 클로드 4.7를 이겼다?"...'벤딩벤치'가 보여준 전략의 차이

AI모델벤치마크성능비교전략차이최적화신뢰성경쟁
오픈AI 새 인공지능 모델 ‘GPT-5.5’ 공개…“가장 똑똑하고 직관적”국민일보
2026. 4. 24. 오후 12:45

오픈AI 새 인공지능 모델 ‘GPT-5.5’ 공개…“가장 똑똑하고 직관적”

AI모델GPT벤치마크성능비교에이전트오픈AI앤트로픽기술경쟁
오픈AI, 자율성 높인 GPT-5.5 출시…앤트로픽보다 우위 자신헤럴드경제
2026. 4. 24. 오전 7:28

오픈AI, 자율성 높인 GPT-5.5 출시…앤트로픽보다 우위 자신

AI모델자율성벤치마크에이전트GPT-5.5클로드성능비교토큰
메타, 초지능 AI ‘뮤즈’ 대반격… 챗GPT-제미나이 성능 맞먹어동아일보
2026. 4. 10. 오전 12:30

메타, 초지능 AI ‘뮤즈’ 대반격… 챗GPT-제미나이 성능 맞먹어

AI모델초지능성능비교멀티에이전트벤치마크메타폐쇄형배포AI글라스
메타 초지능팀 첫 AI '뮤즈' 공개…주가 6.5%↑이데일리
2026. 4. 9. 오전 7:08

메타 초지능팀 첫 AI '뮤즈' 공개…주가 6.5%↑

AI모델초지능벤치마크성능비교무료제공구독료멀티플랫폼AI안경
메타, 초지능팀 첫 AI모델 발표…오픈AI·구글 경쟁작에 필적v.daum.net
2026. 4. 9. 오전 3:48

메타, 초지능팀 첫 AI모델 발표…오픈AI·구글 경쟁작에 필적

AI모델초지능벤치마크성능비교안전성폐쇄형멀티모달생성AI
[주末머니]AI 데이터센터 수요 증가에 조선株 웃는 이유?아시아경제
2026. 4. 26. 오전 9:29

[주末머니]AI 데이터센터 수요 증가에 조선株 웃는 이유?

AI데이터센터가스터빈발전엔진조선전력수요납기단축공급병목가동률
에포크 AI "AI 챗봇, 소득 따라 엇갈려...'클로드'는 부유층이 많이 써"AI타임스
2026. 4. 26. 오전 11:16

에포크 AI "AI 챗봇, 소득 따라 엇갈려...'클로드'는 부유층이 많이 써"

AI챗봇소득격차사용자분석클로드메타AI챗GPT제미나이코파일럿
AI 능력에도 ‘우상향 그래프’ 확산…평가 기준 논쟁글로벌이코노믹
2026. 4. 26. 오전 5:00

AI 능력에도 ‘우상향 그래프’ 확산…평가 기준 논쟁

AI성능평가기준성능지표투자판단AI경쟁자동화능력벤치마크시장기대
범죄자들의 공범은 AI?… 美 검찰, 플로리다 총격범 사용 '챗GPT' 형사 수사전자신문
2026. 4. 25. 오후 4:50

범죄자들의 공범은 AI?… 美 검찰, 플로리다 총격범 사용 '챗GPT' 형사 수사

AI챗봇범죄조사총기범죄생성AI책임논쟁
"말 잘 듣는 비서 넘어 동료로"…오픈AI, GPT 5.5 공개v.daum.net
2026. 4. 24. 오전 11:08

"말 잘 듣는 비서 넘어 동료로"…오픈AI, GPT 5.5 공개

AI모델추론능력자율성에이전트슈퍼앱컴퓨터비전보안벤치마크
세계 최대 규모 올림피아드 수학 데이터셋 ‘매스넷(MathNet)’ 오픈소스로 공개...MIT, AI 추론 능력 검증과 교육 민주화인공지능신문
2026. 4. 25. 오전 10:22

세계 최대 규모 올림피아드 수학 데이터셋 ‘매스넷(MathNet)’ 오픈소스로 공개...MIT, AI 추론 능력 검증과 교육 민주화

오픈소스수학데이터셋AI추론올림피아드벤치마크언어모델교육기술증명기반