IT뉴스모아news terminal

article detail

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증"

네이트AI안전다국어대규모언어모델문화적민감성벤치마크안전성평가오픈소스평가지표
2026. 6. 4. 오전 10:03
KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증"

AI 요약

KT가 글로벌 기업, 공공기관, 학계 등과 함께 대규모언어모델의 안전성과 문화적 민감성 인식 능력을 통합 평가하는 다국어 벤치마크 XL-SafetyBench를 공개했으며, 한국·미국·독일·일본·튀르키예·아랍에미리트 등 10개국의 언어·문화적 특성을 반영한 총 5500개 규모(프롬프트)로 설계되어 각 국가의 사회적 규범과 문화적 민감성 인지를 측정하도록 구성되었습니다. 벤치마크 데이터셋과 평가 코드는 허깅페이스와 깃허브를 통해 공개되었고, 연구진은 주요 LLM 37종을 대상으로 평가를 수행해 분석 결과를 아카이브에 공개했습니다. 에임인텔리전스, 마이크로소프트, 한국 인공지능안전연구소(AISI), 뮌헨공과대학교·앙카라대학교·서울대학교 등 민·관·학 10개 기관 소속 전문가 17명이 공동 연구에 참여했으며 KT의 RAI 전담 조직이 핵심 평가 지표 설계와 평가 로직 구현을 맡아 실제 서비스 환경 적용을 목표로 연구를 진행하고 있습니다.

원문보기
feed://articles/related관련 기사
KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개v.daum.net
2026. 6. 4. 오후 12:49

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

LLM안전성벤치마크다국어문화민감성평가지표오픈소스AI안전
KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력이투데이
2026. 6. 4. 오전 10:10

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가지표AI안전언어모델
KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력네이트
2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가지표언어모델AI안전
KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력v.daum.net
2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가언어모델AI안전
KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개아이뉴스24
2026. 6. 4. 오후 12:47

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

LLM안전성벤치마크다국어문화민감성평가지표언어모델AI윤리
KT, 다국어 벤치마크 공개…LLM 안전성·문화적 민감성 검증전자신문
2026. 6. 4. 오전 10:11

KT, 다국어 벤치마크 공개…LLM 안전성·문화적 민감성 검증

LLM벤치마크안전성문화민감성다국어AI윤리평가지표데이터셋
알리바바, ‘中 1위’ 차세대 AI 칩셋 ‘Qwen3.7’ 프리뷰 기습 공개… “美 턱밑 추격”글로벌이코노믹
2026. 5. 20. 오전 7:45

알리바바, ‘中 1위’ 차세대 AI 칩셋 ‘Qwen3.7’ 프리뷰 기습 공개… “美 턱밑 추격”

AI모델생성형AI대규모언어모델벤치마크오픈소스클라우드API칩셋
에임인텔리전스, 다국어 AI 안전성 벤치마크 'XL-세이프티벤치' 공개AI타임스
2026. 6. 4. 오후 12:26

에임인텔리전스, 다국어 AI 안전성 벤치마크 'XL-세이프티벤치' 공개

LLMAI안전성벤치마크다국어AI평가레드팀문화민감성AI가드레일
KT, 다국어 벤치마크 공개…"안전성·문화적 민감성 평가"디지털데일리
2026. 6. 4. 오전 11:15

KT, 다국어 벤치마크 공개…"안전성·문화적 민감성 평가"

언어모델안전성평가문화민감성다국어벤치마크AI안전규범인식
'민감한 문화 차이 반영했나' KT, AI 평가 다국어 벤치마크 개발네이트
2026. 6. 4. 오전 11:16

'민감한 문화 차이 반영했나' KT, AI 평가 다국어 벤치마크 개발

LLM안전성문화민감성벤치마크다국어프롬프트AI평가언어모델
KT, 다국어 벤치마크 'XL-세이프티벤치' 공개글로벌이코노믹
2026. 6. 4. 오전 10:53

KT, 다국어 벤치마크 'XL-세이프티벤치' 공개

다국어벤치마크LLMAI안전성문화민감성프롬프트평가데이터신뢰성
KT, 다국어 벤치마크 ‘XL-SafetyBench’ 공개⋯ “안전성·문화적 민감성 검증”브릿지경제
2026. 6. 4. 오전 10:02

KT, 다국어 벤치마크 ‘XL-SafetyBench’ 공개⋯ “안전성·문화적 민감성 검증”

LLM벤치마크다국어안전성문화민감성AI윤리평가데이터신뢰성