IT뉴스모아news terminal

article detail

에임인텔리전스, 다국어 AI 안전성 벤치마크 'XL-세이프티벤치' 공개

AI타임스AI가드레일AI안전성AI평가LLM다국어레드팀문화민감성벤치마크
2026. 6. 4. 오후 12:26
에임인텔리전스, 다국어 AI 안전성 벤치마크 'XL-세이프티벤치' 공개

AI 요약

에임인텔리전스(대표 유상윤)는 4일 다문화·다국어 환경에서 대형언어모델(LLM)의 안전성을 평가하는 벤치마크 XL-세이프티벤치를 공개했으며, 이 벤치마크는 37개 주요 LLM을 대상으로 10개국에서 5500개의 현지화 테스트를 거쳐 현지 리스크 트랙과 문화적 민감성 트랙으로 각국의 법적·제도적·문화적 특수성을 반영하도록 설계됐습니다. MS AI 레드팀을 비롯해 한국 인공지능안전연구소(AISI), KT, BMW 그룹, 서울대 등 10개 기관이 참여했으며 논문은 아카이브에, 데이터셋은 허깅페이스에 공개돼 연구자와 개발자가 활용할 수 있고 에임인텔리전스는 비전 AI 및 피지컬 AI 분야에서도 AI 가드레일과 AI 레드티밍 솔루션을 제공한다고 밝혔습니다.

원문보기
feed://articles/related관련 기사
'민감한 문화 차이 반영했나' KT, AI 평가 다국어 벤치마크 개발네이트
2026. 6. 4. 오전 11:16

'민감한 문화 차이 반영했나' KT, AI 평가 다국어 벤치마크 개발

LLM안전성문화민감성벤치마크다국어프롬프트AI평가언어모델
KT, 다국어 벤치마크 'XL-세이프티벤치' 공개글로벌이코노믹
2026. 6. 4. 오전 10:53

KT, 다국어 벤치마크 'XL-세이프티벤치' 공개

다국어벤치마크LLMAI안전성문화민감성프롬프트평가데이터신뢰성
KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력v.daum.net
2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가언어모델AI안전
KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개v.daum.net
2026. 6. 4. 오후 12:49

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

LLM안전성벤치마크다국어문화민감성평가지표오픈소스AI안전
KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개아이뉴스24
2026. 6. 4. 오후 12:47

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

LLM안전성벤치마크다국어문화민감성평가지표언어모델AI윤리
KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력이투데이
2026. 6. 4. 오전 10:10

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가지표AI안전언어모델
KT, 다국어 벤치마크 공개…LLM 안전성·문화적 민감성 검증전자신문
2026. 6. 4. 오전 10:11

KT, 다국어 벤치마크 공개…LLM 안전성·문화적 민감성 검증

LLM벤치마크안전성문화민감성다국어AI윤리평가지표데이터셋
KT, 다국어 벤치마크 ‘XL-SafetyBench’ 공개⋯ “안전성·문화적 민감성 검증”브릿지경제
2026. 6. 4. 오전 10:02

KT, 다국어 벤치마크 ‘XL-SafetyBench’ 공개⋯ “안전성·문화적 민감성 검증”

LLM벤치마크다국어안전성문화민감성AI윤리평가데이터신뢰성
KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력네이트
2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가지표언어모델AI안전
에임인텔리전스, 10개국 문화·법률 반영 AI 안전성 벤치마크 ‘XL-SafetyBench’ 공개플래텀(Platum)
2026. 6. 4. 오전 9:50

에임인텔리전스, 10개국 문화·법률 반영 AI 안전성 벤치마크 ‘XL-SafetyBench’ 공개

AI안전성벤치마크LLM현지화문화민감성다국가평가언어모델안전평가
“AI가 잘못된 판단 내리게 하면 상금” 프론티어 AI 안전성 시험한다v.daum.net
2026. 4. 8. 오후 3:39

“AI가 잘못된 판단 내리게 하면 상금” 프론티어 AI 안전성 시험한다

AI안전성레드팀프롬프트취약점벤치마크오작동응급의료AI평가
AI, 희귀 언어까지 정복하나…제미나이, 키냐르완다어서 4.5점 이상 기록디지털투데이
2026. 4. 18. 오후 8:47

AI, 희귀 언어까지 정복하나…제미나이, 키냐르완다어서 4.5점 이상 기록

AI모델다국어LLM희귀언어벤치마크합성데이터언어성능문화맥락