IT뉴스모아news terminal

article detail

에임인텔리전스, 10개국 문화·법률 반영 AI 안전성 벤치마크 ‘XL-SafetyBench’ 공개

플래텀(Platum)AI안전성LLM다국가평가문화민감성벤치마크안전평가언어모델현지화

2026. 6. 4. 오전 9:50

에임인텔리전스, 10개국 문화·법률 반영 AI 안전성 벤치마크 ‘XL-SafetyBench’ 공개

AI 요약

AI 보안 전문기업 에임인텔리전스가 전 세계 각국의 법률·제도·문화적 맥락을 반영해 대규모 언어모델(LLM)의 신뢰성을 평가하는 글로벌 벤치마크 XL-SafetyBench를 공개했습니다. 영어권 프롬프트 번역 방식과 달리 10개국을 대상으로 5,500개의 현지화 테스트 케이스로 37개 주요 LLM을 평가하며, 현지 리스크 트랙과 문화적 민감성 트랙을 통해 모델의 위험 인지 능력과 이른바 안전성의 착시(Illusion of Safety) 여부를 구분하는 것이 특징입니다. 이번 프로젝트에는 마이크로소프트, 한국 인공지능안전연구소, KT, BMW 그룹, 뮌헨공과대학교, 앙카라대학교, 서울대학교 등 10개 기관의 17명이 공동 저자로 참여했으며 논문과 데이터셋은 아카이브(arXiv)와 허깅페이스(Hugging Face)에 공개됐습니다.

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개 — IT뉴스모아

news.dlwlrmaon.com

2026. 6. 3. 오후 8:49

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개 — IT뉴스모아

AI안전성벤치마크다국어LLM문화민감성평가도구

에임인텔리전스, 10개국 문화·법률 반영 AI 안전성 벤치마크 ‘XL-SafetyBench’ 공개 — IT뉴스모아

news.dlwlrmaon.com

2026. 6. 3. 오후 5:50

에임인텔리전스, 10개국 문화·법률 반영 AI 안전성 벤치마크 ‘XL-SafetyBench’ 공개 — IT뉴스모아

AI안전성벤치마크다국어LLM문화민감성리스크관리

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증" — IT뉴스모아

news.dlwlrmaon.com

2026. 6. 3. 오후 6:03

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증" — IT뉴스모아

LLM벤치마크안전성다국어문화민감성오픈소스평가도구언어모델

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가AI안전언어모델

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가언어모델AI안전

에임인텔리전스, 다국어 AI 안전성 벤치마크 'XL-세이프티벤치' 공개

2026. 6. 4. 오후 12:26

에임인텔리전스, 다국어 AI 안전성 벤치마크 'XL-세이프티벤치' 공개

LLMAI안전성벤치마크다국어AI평가레드팀문화민감성AI가드레일

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

2026. 6. 4. 오후 12:47

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

LLM안전성벤치마크다국어문화민감성평가지표언어모델AI윤리

'민감한 문화 차이 반영했나' KT, AI 평가 다국어 벤치마크 개발

2026. 6. 4. 오전 11:16

'민감한 문화 차이 반영했나' KT, AI 평가 다국어 벤치마크 개발

LLM안전성문화민감성벤치마크다국어프롬프트AI평가언어모델

KT, 다국어 벤치마크 'XL-세이프티벤치' 공개

글로벌이코노믹

2026. 6. 4. 오전 10:53

KT, 다국어 벤치마크 'XL-세이프티벤치' 공개

다국어벤치마크LLMAI안전성문화민감성프롬프트평가데이터신뢰성

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

2026. 6. 4. 오전 10:10

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가지표AI안전언어모델

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가지표언어모델AI안전

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

2026. 6. 4. 오후 12:49

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

대규모언어모델AI안전성벤치마크다국어평가문화민감성LLM평가AI보안오픈소스