IT뉴스모아news terminal

article detail

KT, 다국어 벤치마크 'XL-세이프티벤치' 공개

글로벌이코노믹AI안전성LLM다국어문화민감성벤치마크신뢰성평가데이터프롬프트
2026. 6. 4. 오전 10:53
KT, 다국어 벤치마크 'XL-세이프티벤치' 공개

AI 요약

4일 KT가 글로벌 기업·공공기관·학계와 함께 다국어 벤치마크 'XL-세이프티벤치'를 공개했으며 이 벤치마크는 한국·미국·독일·일본·튀르키예·아랍에미리트 등 10개국의 언어·문화적 특성을 반영한 총 5500개 규모의 프롬프트로 LLM의 사회적 규범과 문화적 민감성 인지 능력을 측정하도록 설계됐습니다. 벤치마크 데이터셋과 평가 코드는 허깅페이스와 깃허브를 통해 공개되었고 연구진은 주요 LLM 37종을 평가해 분석 결과를 아카이브에 공개했으며 국내·외 민·관·학 10개 기관 소속 전문가 17명이 공동 연구에 참여했습니다. 에임인텔리전스는 실제 공격 패턴을 반영한 데이터 구축과 검수 프로세스를 맡았고 마이크로소프트와 한국인공지능안전연구소는 평가 관점 보강에 참여했으며 KT는 이를 바탕으로 AI 안전성·신뢰성 연구를 확대해 AICT기업 전환과 실제 서비스 적용을 추진할 계획입니다.

원문보기
feed://articles/related관련 기사
KT, 다국어 벤치마크 ‘XL-SafetyBench’ 공개⋯ “안전성·문화적 민감성 검증”브릿지경제
2026. 6. 4. 오전 10:02

KT, 다국어 벤치마크 ‘XL-SafetyBench’ 공개⋯ “안전성·문화적 민감성 검증”

LLM벤치마크다국어안전성문화민감성AI윤리평가데이터신뢰성
에임인텔리전스, 다국어 AI 안전성 벤치마크 'XL-세이프티벤치' 공개AI타임스
2026. 6. 4. 오후 12:26

에임인텔리전스, 다국어 AI 안전성 벤치마크 'XL-세이프티벤치' 공개

LLMAI안전성벤치마크다국어AI평가레드팀문화민감성AI가드레일
'민감한 문화 차이 반영했나' KT, AI 평가 다국어 벤치마크 개발네이트
2026. 6. 4. 오전 11:16

'민감한 문화 차이 반영했나' KT, AI 평가 다국어 벤치마크 개발

LLM안전성문화민감성벤치마크다국어프롬프트AI평가언어모델
KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력v.daum.net
2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가언어모델AI안전
KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개v.daum.net
2026. 6. 4. 오후 12:49

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

LLM안전성벤치마크다국어문화민감성평가지표오픈소스AI안전
KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개아이뉴스24
2026. 6. 4. 오후 12:47

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

LLM안전성벤치마크다국어문화민감성평가지표언어모델AI윤리
KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력이투데이
2026. 6. 4. 오전 10:10

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가지표AI안전언어모델
KT, 다국어 벤치마크 공개…LLM 안전성·문화적 민감성 검증전자신문
2026. 6. 4. 오전 10:11

KT, 다국어 벤치마크 공개…LLM 안전성·문화적 민감성 검증

LLM벤치마크안전성문화민감성다국어AI윤리평가지표데이터셋
KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력네이트
2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가지표언어모델AI안전
에임인텔리전스, 10개국 문화·법률 반영 AI 안전성 벤치마크 ‘XL-SafetyBench’ 공개플래텀(Platum)
2026. 6. 4. 오전 9:50

에임인텔리전스, 10개국 문화·법률 반영 AI 안전성 벤치마크 ‘XL-SafetyBench’ 공개

AI안전성벤치마크LLM현지화문화민감성다국가평가언어모델안전평가
“LLM은 거짓을 거짓으로 알면서도 사실처럼 말한다”… 미세조정 실험으로 드러난 ‘자신감 편향’AI 매터스
2026. 5. 29. 오전 10:24

“LLM은 거짓을 거짓으로 알면서도 사실처럼 말한다”… 미세조정 실험으로 드러난 ‘자신감 편향’

LLM자신감편향미세조정사실성거짓정보프롬프트벤치마크안전성
시스코, LLM으로 보안 사고 보고서 써봤더니.."시간 줄었지만 환각 위험 여전"디지털투데이
2026. 5. 25. 오전 8:08

시스코, LLM으로 보안 사고 보고서 써봤더니.."시간 줄었지만 환각 위험 여전"

LLM보안사고대응환각보고서프롬프트검증신뢰성