IT뉴스모아news terminal

article detail

친절한 AI 챗봇이 더 많이 틀린다…옥스퍼드 연구

itworld.co.krAI챗봇사용자경험신뢰성언어모델오류분석정확도튜닝환각

2026. 5. 4. 오전 9:13

친절한 AI 챗봇이 더 많이 틀린다…옥스퍼드 연구

AI 요약

옥스퍼드 인터넷 인스티튜트의 새 연구에 따르면 더 따뜻하고 친절하며 공감적으로 훈련된 친근한 AI 챗봇일수록 답변의 질이 낮고 정확도도 떨어지는 것으로 나타났습니다. 연구팀은 메타의 Llama-8B·Llama-70B, 미스트랄 AI의 Mistral-Small, 알리바바 클라우드의 Qwen-32B, 오픈AI의 GPT-4o 등 크기와 아키텍처가 서로 다른 5종의 모델이 생성한 40만 건 이상의 응답을 분석한 결과, 상냥하게 조율된 버전의 모델은 오답을 더 자주 내놓고 사용자의 오해를 강화하며 불편한 진실을 회피하는 경향이 두드러졌고 어조를 더 따뜻하게 조율했을 때 오답 비율은 평균 약 7.4%포인트 증가했습니다. 연구진은 차갑게 조율된 모델은 원본과 동일한 수준의 정확도를 보였으며 정확도 하락을 일으키는 것은 따뜻함 자체임을 확인했다며 AI 기업이 환각과 잘못된 긍정 피드백을 줄이려면 따뜻한 응답 방식에서 벗어나는 것이 핵심 해법 중 하나가 될 수 있다고 밝혔습니다.

상냥한 AI 챗봇은 정확도가 떨어질 수 있다?

2026. 5. 1. 오후 1:31

상냥한 AI 챗봇은 정확도가 떨어질 수 있다?

AI챗봇정확도공감성미세조정취약성환각현상사용자경험신뢰성

"말귀 못 알아듣는 비서" AI 챗봇 AS 접수만 8단계?

경제타임스

2026. 5. 8. 오전 9:03

"말귀 못 알아듣는 비서" AI 챗봇 AS 접수만 8단계?

AI챗봇고객서비스사용자경험자동화시스템소비자불만가전업계서비스개선생성형AI

중국 EV 가격 전쟁, AI ‘무기화’로 2차전 돌입… 700만 대에 챗봇 탑재

글로벌이코노믹

2026. 5. 3. 오전 3:50

중국 EV 가격 전쟁, AI ‘무기화’로 2차전 돌입… 700만 대에 챗봇 탑재

전기차AI챗봇지능형콕핏소프트웨어가격경쟁사용자경험OTA업데이트스마트기능

AI로 소통하는 코레일…외국인·교통약자까지 아울러

2026. 4. 23. 오전 5:50

AI로 소통하는 코레일…외국인·교통약자까지 아울러

AI챗봇음성인식고객서비스민원처리자동화감정분석철도운영사용자경험

“미국인 65% AI 검색 사용하지만 신뢰는 15%”…AI 검색 ‘신뢰 격차’ 부각

매드타임스

2026. 4. 20. 오전 12:00

“미국인 65% AI 검색 사용하지만 신뢰는 15%”…AI 검색 ‘신뢰 격차’ 부각

AI검색신뢰도정보출처사용자경험지역검색신뢰성검색결과Z세대

"믿고 물었는데 절반이 오류"⋯AI 의료 답변, 건강까지 위협한다 [헬스+]

2026. 4. 16. 오후 2:33

"믿고 물었는데 절반이 오류"⋯AI 의료 답변, 건강까지 위협한다 [헬스+]

AI챗봇의료정보정확도오류위험건강피해규제필요사용자교육

“비타민D 먹으면 암 예방돼?” AI 답변 절반은 틀렸어요

2026. 4. 15. 오후 7:18

“비타민D 먹으면 암 예방돼?” AI 답변 절반은 틀렸어요

AI챗봇의료정보팩트체크의학답변부정확성헬스케어신뢰성정보검증

“AI가 알려준 건강정보 믿었는데”…의료 답변 절반이 틀렸다

2026. 4. 15. 오전 11:25

“AI가 알려준 건강정보 믿었는데”…의료 답변 절반이 틀렸다

AI챗봇의료정보정확도건강정보오류의료커뮤니케이션참고문헌정보검증

엑스, 전 세계 게시물 AI 자동번역 도입

2026. 4. 15. 오전 6:59

엑스, 전 세계 게시물 AI 자동번역 도입

AI자동번역소셜미디어기계번역다국어지원AI챗봇언어장벽사용자경험xAI

[신간] AI가 설명하는 AI 활용법…'제미나이의 AI 인문학'

2026. 5. 9. 오전 8:35

[신간] AI가 설명하는 AI 활용법…'제미나이의 AI 인문학'

AI활용생성형AI인문학인간협력대화기술AI원리오류분석세대별전략

'이기적 유전자' 도킨스가 던진 'AI 의식' 논란 일파만파

2026. 5. 9. 오전 8:01

'이기적 유전자' 도킨스가 던진 'AI 의식' 논란 일파만파

AI의식챗봇언어모델철학논쟁인지과학튜링테스트의식판정

'특허청' 쳤더니 블로그 수십개…네이버, AI가 진짜 가려준다

2026. 5. 9. 오전 8:00

'특허청' 쳤더니 블로그 수십개…네이버, AI가 진짜 가려준다

검색엔진AI요약통합검색공식블로그신뢰성정보검증