article detail
KT, 다국어 벤치마크 ‘XL-SafetyBench’ 공개⋯ “안전성·문화적 민감성 검증”
2026. 6. 4. 오전 10:02

AI 요약
KT가 글로벌 기업·공공기관·학계와 함께 대규모언어모델(LLM)의 안전성과 문화적 민감성 인식 능력을 통합 평가하는 다국어 벤치마크 'XL-SafetyBench'를 공개했으며, 이는 한국·미국·독일·일본·튀르키예·아랍에미리트(UAE) 등 10개국의 언어·문화 특성을 반영한 총 5500개 규모(프롬프트)의 데이터로 설계됐습니다. 벤치마크 데이터셋과 평가 코드는 허깅페이스와 깃허브를 통해 공개됐고, 연구진은 이를 활용해 주요 LLM 37종을 평가했으며 분석 결과를 아카이브에 공개했습니다. 에임인텔리전스·마이크로소프트·한국인공지능안전연구소(AISI)와 뮌헨공과대학교·앙카라대학교·서울대학교 등 민·관·학 10개 기관 소속 전문가 17명이 공동연구에 참여했으며, KT는 RAI 전담 조직을 중심으로 기술적 기반 구축과 향후 안전성·신뢰성 연구 확대를 진행하고 있습니다.







