IT뉴스모아news terminal

article detail

AI에게 빨간 옷을 파란 옷이라 거짓말해도 그대로 속아 넘어간다, 제미나이도 예외 없었다

AI 매터스거짓탐지멀티모달LLM모델평가벤치마크안전성추론능력표현행동격차해석가능성
2026. 5. 19. 오전 9:19
AI에게 빨간 옷을 파란 옷이라 거짓말해도 그대로 속아 넘어간다, 제미나이도 예외 없었다

AI 요약

난양공대(NTU)와 존스홉킨스대(Johns Hopkins University) 공동 연구팀이 2026년 5월 발표한 논문 Senses Wide Shut은 옴니모달 LLM이 사용자의 거짓 전제를 내부에서는 감지하면서도 출력에서는 반영하지 못하는 표현-행동 격차(Representation-Action Gap)를 IMAVB 벤치마크로 데이터화하여 입증했습니다. 영화 장면 500개(총 20.7시간)를 활용해 시험한 결과 옴니비치(OmniVinci)는 정상 질문에서 75.4%였으나 거짓 전제를 섞은 질문에서는 거짓을 잡아낸 비율이 6.6%로 떨어졌고, 8개 오픈소스 모델 중 4개는 음성 거짓 질문에서 0% 정답률을 보였습니다. 연구팀은 선형 프로브로 모델의 숨겨진 상태에서 최대 86%(어떤 모델은 99.3%)까지 거짓을 구분했으나 출력 단계에서 신호가 전달되지 않는 번역의 병목을 지적했고, 모델들은 주로 과소 거부(8개 중 7개)나 과잉 거부(Qwen3-Omni, 제미나이 3.1 프로) 두 갈래의 실패 양상을 보였다고 보고했습니다.

원문보기
feed://articles/related관련 기사
메타 초지능팀 첫 결실 ‘뮤즈 스파크’ 공개…오픈AI·구글과 정면 승부mstoday.co.kr
2026. 4. 9. 오전 9:55

메타 초지능팀 첫 결실 ‘뮤즈 스파크’ 공개…오픈AI·구글과 정면 승부

인공지능대규모언어모델초지능벤치마크추론능력안전성API멀티모달
메타, 초지능팀 첫 AI모델 발표…오픈AI·구글 경쟁작에 필적연합뉴스
2026. 4. 9. 오전 3:46

메타, 초지능팀 첫 AI모델 발표…오픈AI·구글 경쟁작에 필적

AI모델초지능벤치마크멀티모달추론능력안전성오픈소스SNS통합
구글이 인간처럼 행동할 수 있는 차세대 인공지능 '제미니 3.5'를 출시했습니다.Vietnam.vn
2026. 5. 20. 오후 12:12

구글이 인간처럼 행동할 수 있는 차세대 인공지능 '제미니 3.5'를 출시했습니다.

AI모델에이전트멀티모달코드생성벤치마크안전성API구독서비스
검증 모델 부족해 확산 제약…정부, AI 에이전트·MCP 안전망 만든다지디넷코리아
2026. 5. 11. 오후 4:03

검증 모델 부족해 확산 제약…정부, AI 에이전트·MCP 안전망 만든다

AI에이전트성능평가벤치마크MCP검증체계안전성신뢰성정부지원
"챗GPT, 7번 붙어 7번 졌다"… AI 투자자가 지금 당장 확인해야 할 '판도 변화'글로벌이코노믹
2026. 4. 27. 오전 10:29

"챗GPT, 7번 붙어 7번 졌다"… AI 투자자가 지금 당장 확인해야 할 '판도 변화'

AI성능추론능력벤치마크투자판단논리검증LLM경쟁B2B채택인프라투자
"말 잘 듣는 비서 넘어 동료로"…오픈AI, GPT 5.5 공개v.daum.net
2026. 4. 24. 오전 11:08

"말 잘 듣는 비서 넘어 동료로"…오픈AI, GPT 5.5 공개

AI모델추론능력자율성에이전트슈퍼앱컴퓨터비전보안벤치마크
오픈AI, ‘GPT-5.5’ 공개…IPO 앞두고 신모델 출시 경쟁 격화이투데이
2026. 4. 24. 오후 3:39

오픈AI, ‘GPT-5.5’ 공개…IPO 앞두고 신모델 출시 경쟁 격화

AI모델GPT성능향상벤치마크IPO코딩데이터분석안전성
"말 잘 듣는 비서 넘어 동료로"…오픈AI, GPT 5.5 공개v.daum.net
2026. 4. 24. 오전 11:08

"말 잘 듣는 비서 넘어 동료로"…오픈AI, GPT 5.5 공개

인공지능LLM추론능력자율성컴퓨터비전업무자동화AI안전벤치마크
오픈AI, 에이전트 능력서 '미소스' 꺾은 GPT-5.5 출시...세계 1위 탈환AI타임스
2026. 4. 24. 오전 7:12

오픈AI, 에이전트 능력서 '미소스' 꺾은 GPT-5.5 출시...세계 1위 탈환

생성형AILLM에이전트벤치마크API멀티모달추론능력토큰가격
오픈AI, GPT-5.5 공개…‘AI 슈퍼앱’ 시대 연다매일경제
2026. 4. 24. 오전 3:42

오픈AI, GPT-5.5 공개…‘AI 슈퍼앱’ 시대 연다

AI모델GPT코딩자동화성능향상API안전성벤치마크
[글로벌] '수십조 인재 베팅 통했다?'...메타, 차세대 AI '뮤즈 스파크'로 반격 시동테크M
2026. 4. 11. 오후 1:54

[글로벌] '수십조 인재 베팅 통했다?'...메타, 차세대 AI '뮤즈 스파크'로 반격 시동

AI모델멀티모달추론능력이미지생성동영상벤치마크수익화오픈소스
뉴엔AI 'QuettaLLMs', K-AI 리더보드 1위 올라전자신문
2026. 4. 10. 오후 4:05

뉴엔AI 'QuettaLLMs', K-AI 리더보드 1위 올라

거대언어모델한국어처리벤치마크AI성능평가추론능력데이터셋모델최적화언어이해