article detail
AI 모델, 리스크 대응력은 ‘클로드’·문화적 이해는 ‘제미나이’ 뛰어나
2026. 6. 4. 오후 3:15
AI 요약
에임인텔리전스가 발표한 글로벌 벤치마크 XL-세이프티벤치는 AI 모델의 현지 리스크 평가와 문화적 민감성 평가로 구성되며 10개국 5,500개 현지 테스트 사례로 평가했습니다. 평가 결과 앤트로픽의 클로드(클로드-4.5 소넷)가 리스크 대응에서 우수했고 구글의 제미나이 3.1 프로가 문화적 민감성에서 최고였으며 SK텔레콤의 에이닷엑스-K1, LG의 엑사원-236B, 업스테이지의 솔라 100B 등 한국 토종 모델들은 글로벌 모델보다 낮은 점수를 기록했습니다. 연구진은 탈옥 방어 등 안전성과 문화 이해도 간 상관관계가 낮고 단순한 현지 언어 학습만으로는 문화적 인식 획득에 한계가 있다고 분석했습니다.







