article detail
사이언스타임즈/사용자메뉴/과학기술/기초·응용과학
2026. 4. 7. 오전 9:00

AI 요약
마운트 시나이 병원의 아이칸 의과대학 연구진은 인공지능이 생성한 X선 이미지와 실제 영상을 섞어 현직 방사선 전문의 17명을 대상으로 판별 실험을 진행했으며, 연구 목적을 알리지 않은 첫 번째 실험에서는 17명 중 41%(7명)만이 합성 이미지가 섞여 있다고 의심했고 합성 이미지와 실제 이미지의 진단 정확도는 각각 92.4%와 91.3%로 유의미한 차이가 없었습니다. 합성 사실을 알린 두 번째 실험에서 방사선 전문의들의 평균 판별 정확도는 74.8%(특이도 80.4%, 민감도 69.1%, 개인별 58–92%)였고, 인공지능 모델은 GPT-4o가 85.1%, GPT-5가 82.5%로 방사선 전문의보다 약간 높은 성능을 보였으나 Gemini 2.5 Pro와 Llama 4 Maverick는 각각 56.5%와 59.1%로 낮은 성능을 보였습니다. 연구진은 합성 이미지가 뼈 표면의 지나친 매끄러움, 균일한 조직 질감, 일정한 노이즈 패턴, 지나치게 완벽한 대칭이나 깔끔한 골절선 등 공통적 특징을 보인다고 밝히며 딥페이크 X선이 보험 사기·소송 자료 조작, 연구 윤리 위협 및 진단 오류를 초래할 위험이 있다고 경고하고 투명성·검증·교육·워터마킹·데이터 세트 관리 등의 대응 전략을 제안하며 학습용 딥페��크 X선 데이터 세트도 공개했습니다.






