article detail
KT, 다국어 벤치마크 공개…LLM 안전성·문화적 민감성 검증
2026. 6. 4. 오전 10:11

AI 요약
KT가 글로벌 기업, 공공기관, 학계 등과 함께 대규모언어모델(LLM)의 안전성과 문화적 민감성 인식 능력을 통합 평가하는 다국어 벤치마크 'XL-SafetyBench'를 공개했습니다. 이 벤치마크는 한국, 미국, 독일, 일본, 튀르키예, 아랍에미리트 등 10개국의 언어·문화적 특성을 반영한 총 5500개 프롬프트로 구성되며 데이터셋과 평가 코드는 허깅페이스와 깃허브를 통해 공개돼 37종 주요 LLM에 대한 평가 결과와 논문이 아카이브에 공개되었습니다. KT는 Responsible AI(RAI) 전담 조직이 핵심 평가 지표 설계와 평가 로직 구현을 맡아 기술적 기반을 구축했으며 앞으로도 AI 안전성·신뢰성 연구를 확대하고 고객의 AI전환(AX)을 지원할 계획입니다.







