IT뉴스모아news terminal

article detail

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

네이트AI보안AI안전성LLM평가다국어평가대규모언어모델문화민감성벤치마크오픈소스
2026. 6. 4. 오후 12:49
KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

AI 요약

KT는 글로벌 기업과 공공기관, 학계 등과 함께 대규모 언어모델의 안전성과 문화적 민감성 인식 능력을 통합 평가하는 다국어 벤치마크 'XL-SafetyBench'를 공개했다고 4일 밝혔습니다. 이 벤치마크는 한국, 미국, 독일, 일본, 튀르키예, 아랍에미리트 등 10개국의 언어·문화적 특성을 반영한 총 5500개 규모로 설계되었으며 데이터셋과 평가 코드는 허깅페이스와 깃허브를 통해 공개되어 누구나 활용할 수 있고, 연구진은 이를 활용해 주요 LLM 37종을 평가해 결과를 arXiv에 공개했습니다. 국내·외 민·관·학 10개 기관 소속 전문가 17명과 AI 보안 전문기업 에임인텔리전스, 마이크로소프트, 한국 인공지능안전연구소(AISI) 등이 공동 참여해 벤치마크 개발과 검수에 기여했습니다.

원문보기
feed://articles/related관련 기사
KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개 — IT뉴스모아news.dlwlrmaon.com
2026. 6. 3. 오후 8:49

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개 — IT뉴스모아

AI안전성벤치마크다국어LLM문화민감성평가도구
에임인텔리전스, 10개국 문화·법률 반영 AI 안전성 벤치마크 ‘XL-SafetyBench’ 공개 — IT뉴스모아news.dlwlrmaon.com
2026. 6. 3. 오후 5:50

에임인텔리전스, 10개국 문화·법률 반영 AI 안전성 벤치마크 ‘XL-SafetyBench’ 공개 — IT뉴스모아

AI안전성벤치마크다국어LLM문화민감성리스크관리
KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증" — IT뉴스모아news.dlwlrmaon.com
2026. 6. 3. 오후 6:03

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증" — IT뉴스모아

LLM벤치마크안전성다국어문화민감성오픈소스평가도구언어모델
KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개v.daum.net
2026. 6. 4. 오후 12:49

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

LLM안전성벤치마크다국어문화민감성평가지표오픈소스AI안전
에임인텔리전스, 다국어 AI 안전성 벤치마크 'XL-세이프티벤치' 공개AI타임스
2026. 6. 4. 오후 12:26

에임인텔리전스, 다국어 AI 안전성 벤치마크 'XL-세이프티벤치' 공개

LLMAI안전성벤치마크다국어AI평가레드팀문화민감성AI가드레일
KT, 다국어 벤치마크 'XL-세이프티벤치' 공개글로벌이코노믹
2026. 6. 4. 오전 10:53

KT, 다국어 벤치마크 'XL-세이프티벤치' 공개

다국어벤치마크LLMAI안전성문화민감성프롬프트평가데이터신뢰성
KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증"네이트
2026. 6. 4. 오전 10:03

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증"

대규모언어모델벤치마크안전성평가문화적민감성다국어AI안전평가지표오픈소스
에임인텔리전스, 10개국 문화·법률 반영 AI 안전성 벤치마크 ‘XL-SafetyBench’ 공개플래텀(Platum)
2026. 6. 4. 오전 9:50

에임인텔리전스, 10개국 문화·법률 반영 AI 안전성 벤치마크 ‘XL-SafetyBench’ 공개

AI안전성벤치마크LLM현지화문화민감성다국가평가언어모델안전평가
Web3 특화 AI 벤치마크 ‘DMind Benchmark’, KDD 2026 공식 채택이데일리
2026. 5. 26. 오후 2:48

Web3 특화 AI 벤치마크 ‘DMind Benchmark’, KDD 2026 공식 채택

LLM평가Web3블록체인벤치마크스마트컨트랙트오픈소스AI모델보안취약점
알리바바, ‘中 1위’ 차세대 AI 칩셋 ‘Qwen3.7’ 프리뷰 기습 공개… “美 턱밑 추격”글로벌이코노믹
2026. 5. 20. 오전 7:45

알리바바, ‘中 1위’ 차세대 AI 칩셋 ‘Qwen3.7’ 프리뷰 기습 공개… “美 턱밑 추격”

AI모델생성형AI대규모언어모델벤치마크오픈소스클라우드API칩셋
앤트로픽, 빅테크와 AI 보안 연합 구축…′글래스윙′ 출범alphabiz.co.kr
2026. 4. 8. 오전 7:58

앤트로픽, 빅테크와 AI 보안 연합 구축…′글래스윙′ 출범

AI보안사이버보안취약점분석모델공개보안협력오픈소스AI안전성정부협력
[테크스냅] KT, 'XL-세이프티벤치' 벤치마크 공개 — IT뉴스모아news.dlwlrmaon.com
2026. 6. 3. 오후 6:32

[테크스냅] KT, 'XL-세이프티벤치' 벤치마크 공개 — IT뉴스모아

LLM안전성평가벤치마크다국어문화민감성AI안전