article detail
KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개
2026. 6. 4. 오후 12:49
AI 요약
KT는 글로벌 기업과 공공기관, 학계 등과 함께 대규모 언어모델의 안전성과 문화적 민감성 인식 능력을 통합 평가하는 다국어 벤치마크 'XL-SafetyBench'를 공개했다고 4일 밝혔습니다. 이 벤치마크는 한국, 미국, 독일, 일본, 튀르키예, 아랍에미리트 등 10개국의 언어·문화적 특성을 반영한 총 5500개 규모로 설계되었으며 데이터셋과 평가 코드는 허깅페이스와 깃허브를 통해 공개되어 누구나 활용할 수 있고, 연구진은 이를 활용해 주요 LLM 37종을 평가해 결과를 arXiv에 공개했습니다. 국내·외 민·관·학 10개 기관 소속 전문가 17명과 AI 보안 전문기업 에임인텔리전스, 마이크로소프트, 한국 인공지능안전연구소(AISI) 등이 공동 참여해 벤치마크 개발과 검수에 기여했습니다.






![[테크스냅] KT, 'XL-세이프티벤치' 벤치마크 공개 — IT뉴스모아](https://img8.yna.co.kr/etc/inner/KR/2026/06/04/AKR20260604093600017_01_i_P4.jpg)