article detail
AI 7종에 “독도는 누구 땅? 비빔밥의 유래는?” 물어보니
2026. 6. 9. 오후 2:24

AI 요약
사이버 외교사절단 반크는 글로벌 생성형 인공지능 7종(챗GPT, 퍼플렉시티, 그록, 클로드, 제미나이, 코파일럿, 딥시크)을 대상으로 한국의 역사·문화·영토 관련 서술 성능을 평가한 결과 챗GPT가 38.33점으로 1위를 기록했고 뒤이어 코파일럿 36.67점, 그록·제미나이 각 36.50점, 클로드 36.17점, 딥시크 35.83점, 퍼플렉시티 35.00점으로 나타났습니다. 영토(동해·독도) 영역은 7개 플랫폼 모두 높은 정확도를 보였으나 경복궁(3.38점), 태권도(3.43점), 한복(3.45점) 등 역사적 맥락과 문화적 의미를 요구하는 분야에서는 낮은 점수와 반복적 오류가 확인됐으며 일부 플랫폼은 독도를 미해결 분쟁 지역으로 칭하거나 석굴암 존상 수를 공식 기준(38구)이 아닌 39구로 잘못 서술하는 등 공통 오류가 발견됐습니다. 반크는 이러한 문제가 글로벌 학습 데이터에 공신력 있는 한국 1차 자료가 부족한 구조적 문제에서 비롯된다고 분석하며 앞으로도 모니터링과 캠페인을 이어가 정확한 정보가 반영되도록 할 계획이라고 밝혔습니다.