IT뉴스모아news terminal

article detail

KT, 다국어 벤치마크 공개…LLM 안전성·문화적 민감성 검증

전자신문AI윤리LLM다국어데이터셋문화민감성벤치마크안전성평가지표
2026. 6. 4. 오전 10:11
KT, 다국어 벤치마크 공개…LLM 안전성·문화적 민감성 검증

AI 요약

KT가 글로벌 기업, 공공기관, 학계 등과 함께 대규모언어모델(LLM)의 안전성과 문화적 민감성 인식 능력을 통합 평가하는 다국어 벤치마크 'XL-SafetyBench'를 공개했습니다. 이 벤치마크는 한국, 미국, 독일, 일본, 튀르키예, 아랍에미리트 등 10개국의 언어·문화적 특성을 반영한 총 5500개 프롬프트로 구성되며 데이터셋과 평가 코드는 허깅페이스와 깃허브를 통해 공개돼 37종 주요 LLM에 대한 평가 결과와 논문이 아카이브에 공개되었습니다. KT는 Responsible AI(RAI) 전담 조직이 핵심 평가 지표 설계와 평가 로직 구현을 맡아 기술적 기반을 구축했으며 앞으로도 AI 안전성·신뢰성 연구를 확대하고 고객의 AI전환(AX)을 지원할 계획입니다.

원문보기
feed://articles/related관련 기사
KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개아이뉴스24
2026. 6. 4. 오후 12:47

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

LLM안전성벤치마크다국어문화민감성평가지표언어모델AI윤리
KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개v.daum.net
2026. 6. 4. 오후 12:49

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

LLM안전성벤치마크다국어문화민감성평가지표오픈소스AI안전
KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력이투데이
2026. 6. 4. 오전 10:10

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가지표AI안전언어모델
KT, 다국어 벤치마크 ‘XL-SafetyBench’ 공개⋯ “안전성·문화적 민감성 검증”브릿지경제
2026. 6. 4. 오전 10:02

KT, 다국어 벤치마크 ‘XL-SafetyBench’ 공개⋯ “안전성·문화적 민감성 검증”

LLM벤치마크다국어안전성문화민감성AI윤리평가데이터신뢰성
KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력네이트
2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가지표언어모델AI안전
'민감한 문화 차이 반영했나' KT, AI 평가 다국어 벤치마크 개발네이트
2026. 6. 4. 오전 11:16

'민감한 문화 차이 반영했나' KT, AI 평가 다국어 벤치마크 개발

LLM안전성문화민감성벤치마크다국어프롬프트AI평가언어모델
에임인텔리전스, 다국어 AI 안전성 벤치마크 'XL-세이프티벤치' 공개AI타임스
2026. 6. 4. 오후 12:26

에임인텔리전스, 다국어 AI 안전성 벤치마크 'XL-세이프티벤치' 공개

LLMAI안전성벤치마크다국어AI평가레드팀문화민감성AI가드레일
KT, 다국어 벤치마크 'XL-세이프티벤치' 공개글로벌이코노믹
2026. 6. 4. 오전 10:53

KT, 다국어 벤치마크 'XL-세이프티벤치' 공개

다국어벤치마크LLMAI안전성문화민감성프롬프트평가데이터신뢰성
KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증"네이트
2026. 6. 4. 오전 10:03

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증"

대규모언어모델벤치마크안전성평가문화적민감성다국어AI안전평가지표오픈소스
에임인텔리전스, 10개국 문화·법률 반영 AI 안전성 벤치마크 ‘XL-SafetyBench’ 공개플래텀(Platum)
2026. 6. 4. 오전 9:50

에임인텔리전스, 10개국 문화·법률 반영 AI 안전성 벤치마크 ‘XL-SafetyBench’ 공개

AI안전성벤치마크LLM현지화문화민감성다국가평가언어모델안전평가
“LLM은 거짓을 거짓으로 알면서도 사실처럼 말한다”… 미세조정 실험으로 드러난 ‘자신감 편향’AI 매터스
2026. 5. 29. 오전 10:24

“LLM은 거짓을 거짓으로 알면서도 사실처럼 말한다”… 미세조정 실험으로 드러난 ‘자신감 편향’

LLM자신감편향미세조정사실성거짓정보프롬프트벤치마크안전성
AI, 희귀 언어까지 정복하나…제미나이, 키냐르완다어서 4.5점 이상 기록디지털투데이
2026. 4. 18. 오후 8:47

AI, 희귀 언어까지 정복하나…제미나이, 키냐르완다어서 4.5점 이상 기록

AI모델다국어LLM희귀언어벤치마크합성데이터언어성능문화맥락