IT뉴스모아news terminal

article detail

KT, 다국어 벤치마크 ‘XL-SafetyBench’ 공개⋯ “안전성·문화적 민감성 검증”

브릿지경제AI윤리LLM다국어문화민감성벤치마크신뢰성안전성평가데이터
2026. 6. 4. 오전 10:02
KT, 다국어 벤치마크 ‘XL-SafetyBench’ 공개⋯ “안전성·문화적 민감성 검증”

AI 요약

KT가 글로벌 기업·공공기관·학계와 함께 대규모언어모델(LLM)의 안전성과 문화적 민감성 인식 능력을 통합 평가하는 다국어 벤치마크 'XL-SafetyBench'를 공개했으며, 이는 한국·미국·독일·일본·튀르키예·아랍에미리트(UAE) 등 10개국의 언어·문화 특성을 반영한 총 5500개 규모(프롬프트)의 데이터로 설계됐습니다. 벤치마크 데이터셋과 평가 코드는 허깅페이스와 깃허브를 통해 공개됐고, 연구진은 이를 활용해 주요 LLM 37종을 평가했으며 분석 결과를 아카이브에 공개했습니다. 에임인텔리전스·마이크로소프트·한국인공지능안전연구소(AISI)와 뮌헨공과대학교·앙카라대학교·서울대학교 등 민·관·학 10개 기관 소속 전문가 17명이 공동연구에 참여했으며, KT는 RAI 전담 조직을 중심으로 기술적 기반 구축과 향후 안전성·신뢰성 연구 확대를 진행하고 있습니다.

원문보기
feed://articles/related관련 기사
KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개아이뉴스24
2026. 6. 4. 오후 12:47

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

LLM안전성벤치마크다국어문화민감성평가지표언어모델AI윤리
KT, 다국어 벤치마크 'XL-세이프티벤치' 공개글로벌이코노믹
2026. 6. 4. 오전 10:53

KT, 다국어 벤치마크 'XL-세이프티벤치' 공개

다국어벤치마크LLMAI안전성문화민감성프롬프트평가데이터신뢰성
KT, 다국어 벤치마크 공개…LLM 안전성·문화적 민감성 검증전자신문
2026. 6. 4. 오전 10:11

KT, 다국어 벤치마크 공개…LLM 안전성·문화적 민감성 검증

LLM벤치마크안전성문화민감성다국어AI윤리평가지표데이터셋
KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력v.daum.net
2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가언어모델AI안전
KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개v.daum.net
2026. 6. 4. 오후 12:49

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

LLM안전성벤치마크다국어문화민감성평가지표오픈소스AI안전
'민감한 문화 차이 반영했나' KT, AI 평가 다국어 벤치마크 개발네이트
2026. 6. 4. 오전 11:16

'민감한 문화 차이 반영했나' KT, AI 평가 다국어 벤치마크 개발

LLM안전성문화민감성벤치마크다국어프롬프트AI평가언어모델
KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력이투데이
2026. 6. 4. 오전 10:10

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가지표AI안전언어모델
KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력네이트
2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가지표언어모델AI안전
에임인텔리전스, 다국어 AI 안전성 벤치마크 'XL-세이프티벤치' 공개AI타임스
2026. 6. 4. 오후 12:26

에임인텔리전스, 다국어 AI 안전성 벤치마크 'XL-세이프티벤치' 공개

LLMAI안전성벤치마크다국어AI평가레드팀문화민감성AI가드레일
에임인텔리전스, 10개국 문화·법률 반영 AI 안전성 벤치마크 ‘XL-SafetyBench’ 공개플래텀(Platum)
2026. 6. 4. 오전 9:50

에임인텔리전스, 10개국 문화·법률 반영 AI 안전성 벤치마크 ‘XL-SafetyBench’ 공개

AI안전성벤치마크LLM현지화문화민감성다국가평가언어모델안전평가
“LLM은 거짓을 거짓으로 알면서도 사실처럼 말한다”… 미세조정 실험으로 드러난 ‘자신감 편향’AI 매터스
2026. 5. 29. 오전 10:24

“LLM은 거짓을 거짓으로 알면서도 사실처럼 말한다”… 미세조정 실험으로 드러난 ‘자신감 편향’

LLM자신감편향미세조정사실성거짓정보프롬프트벤치마크안전성
“AI 혁신 속도보다 신뢰”… 정부, ‘국가 AI 윤리원칙’ 초안 공개이데일리
2026. 5. 28. 오후 12:19

“AI 혁신 속도보다 신뢰”… 정부, ‘국가 AI 윤리원칙’ 초안 공개

AI윤리신뢰성생성형AI에이전틱AI프라이버시공정성안전성투명성