article detail
AI에게 빨간 옷을 파란 옷이라 거짓말해도 그대로 속아 넘어간다, 제미나이도 예외 없었다
2026. 5. 19. 오전 9:19

AI 요약
난양공대(NTU)와 존스홉킨스대(Johns Hopkins University) 공동 연구팀이 2026년 5월 발표한 논문 Senses Wide Shut은 옴니모달 LLM이 사용자의 거짓 전제를 내부에서는 감지하면서도 출력에서는 반영하지 못하는 표현-행동 격차(Representation-Action Gap)를 IMAVB 벤치마크로 데이터화하여 입증했습니다. 영화 장면 500개(총 20.7시간)를 활용해 시험한 결과 옴니비치(OmniVinci)는 정상 질문에서 75.4%였으나 거짓 전제를 섞은 질문에서는 거짓을 잡아낸 비율이 6.6%로 떨어졌고, 8개 오픈소스 모델 중 4개는 음성 거짓 질문에서 0% 정답률을 보였습니다. 연구팀은 선형 프로브로 모델의 숨겨진 상태에서 최대 86%(어떤 모델은 99.3%)까지 거짓을 구분했으나 출력 단계에서 신호가 전달되지 않는 번역의 병목을 지적했고, 모델들은 주로 과소 거부(8개 중 7개)나 과잉 거부(Qwen3-Omni, 제미나이 3.1 프로) 두 갈래의 실패 양상을 보였다고 보고했습니다.







