article detail

KT, 한국 문화 특화 AI 벤치마크 'KSAFE-MM' 공개

전자신문

2026. 6. 16. 오전 9:15

AI 요약

KT는 고려대와 공동으로 16일 한국 문화와 사회 이슈를 반영한 멀티모달 AI 안전성 평가 벤치마크 KSAFE-MM을 공개했습니다. KSAFE-MM은 텍스트·이미지·음성 등 멀티모달 대형언어모델(MLLM)의 안전성 평가를 위해 글로벌 공통 위험을 한국 맥락으로 변환한 KSAFE-MM-G와 국내 이슈를 반영한 KSAFE-MM-C로 구성되며 전체 평가 샘플은 1만4135개이고 민감 주제 수집부터 질문 생성·합성 이미지 생성·탈옥 쿼리 생성까지 이어지는 4단계 자동화 파이프라인으로 젬마(Gemma)와 하이퍼클로바 엑스(HyperCLOVA X) 등 12개 글로벌 멀티모달 모델을 검증했다고 설명했습니다. 연구 결과와 데이터는 아카이브와 허깅페이스에 공개됐으며 KT는 벤치마크가 AI 서비스 안전성 검증과 레드팀 테스트, 가드레일 모델 평가 등에 활용될 수 있을 것으로 기대한다고 밝혔습니다.

원문보기