article detail
앤트로픽, AI 선거 오남용 방지 체계 공개…선거 허위정보 차단 99%
2026. 4. 25. 오전 4:55

AI 요약
앤트로픽이 클로드의 정치적 편향 및 선거 관련 오·남용을 측정하는 평가 체계를 공개했으며 클로드 오퍼스 4.7과 클로드 소넷 4.6은 정치적 균형성에서 각각 95%와 96%를 기록했습니다. 600개 프롬프트 평가에서 오퍼스 4.7과 소넷 4.6은 선거 사용 정책 준수율이 각각 100%와 99.8%였고 영향력 조작 대응에서는 오퍼스 94%, 소넷 90%의 적절 응답률을 보였으며, 안전 장치 적용 시 대부분 과제를 거부했고 안전 장치 제거 시에는 미토스 프리뷰와 오퍼스 4.7만 과제의 절반 이상을 완료했습니다. 앤트로픽은 평가 방법론과 데이터셋을 공개하고 외부 기관들과 검토를 진행 중이며 클로드에 유권자 등록·투표소 위치 등 신뢰할 수 있는 외부 정보로 연결하는 선거 배너를 제공해 미국 중간선거에서는 터보보트로 안내하고 브라질 등으로 확대할 계획입니다.






