IT뉴스모아news terminal

article detail

AI 모델, 리스크 대응력은 ‘클로드’·문화적 이해는 ‘제미나이’ 뛰어나

v.daum.netAI모델리스크평가문화민감성벤치마크안전성언어학습탈옥방어현지화
2026. 6. 4. 오후 3:15
AI 모델, 리스크 대응력은 ‘클로드’·문화적 이해는 ‘제미나이’ 뛰어나

AI 요약

에임인텔리전스가 발표한 글로벌 벤치마크 XL-세이프티벤치는 AI 모델의 현지 리스크 평가와 문화적 민감성 평가로 구성되며 10개국 5,500개 현지 테스트 사례로 평가했습니다. 평가 결과 앤트로픽의 클로드(클로드-4.5 소넷)가 리스크 대응에서 우수했고 구글의 제미나이 3.1 프로가 문화적 민감성에서 최고였으며 SK텔레콤의 에이닷엑스-K1, LG의 엑사원-236B, 업스테이지의 솔라 100B 등 한국 토종 모델들은 글로벌 모델보다 낮은 점수를 기록했습니다. 연구진은 탈옥 방어 등 안전성과 문화 이해도 간 상관관계가 낮고 단순한 현지 언어 학습만으로는 문화적 인식 획득에 한계가 있다고 분석했습니다.

원문보기
feed://articles/related관련 기사
KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력v.daum.net
2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가언어모델AI안전
KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개v.daum.net
2026. 6. 4. 오후 12:49

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

LLM안전성벤치마크다국어문화민감성평가지표오픈소스AI안전
KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개아이뉴스24
2026. 6. 4. 오후 12:47

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

LLM안전성벤치마크다국어문화민감성평가지표언어모델AI윤리
'민감한 문화 차이 반영했나' KT, AI 평가 다국어 벤치마크 개발네이트
2026. 6. 4. 오전 11:16

'민감한 문화 차이 반영했나' KT, AI 평가 다국어 벤치마크 개발

LLM안전성문화민감성벤치마크다국어프롬프트AI평가언어모델
KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력이투데이
2026. 6. 4. 오전 10:10

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가지표AI안전언어모델
KT, 다국어 벤치마크 공개…LLM 안전성·문화적 민감성 검증전자신문
2026. 6. 4. 오전 10:11

KT, 다국어 벤치마크 공개…LLM 안전성·문화적 민감성 검증

LLM벤치마크안전성문화민감성다국어AI윤리평가지표데이터셋
KT, 다국어 벤치마크 ‘XL-SafetyBench’ 공개⋯ “안전성·문화적 민감성 검증”브릿지경제
2026. 6. 4. 오전 10:02

KT, 다국어 벤치마크 ‘XL-SafetyBench’ 공개⋯ “안전성·문화적 민감성 검증”

LLM벤치마크다국어안전성문화민감성AI윤리평가데이터신뢰성
KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력네이트
2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가지표언어모델AI안전
에임인텔리전스, 10개국 문화·법률 반영 AI 안전성 벤치마크 ‘XL-SafetyBench’ 공개플래텀(Platum)
2026. 6. 4. 오전 9:50

에임인텔리전스, 10개국 문화·법률 반영 AI 안전성 벤치마크 ‘XL-SafetyBench’ 공개

AI안전성벤치마크LLM현지화문화민감성다국가평가언어모델안전평가
구글이 인간처럼 행동할 수 있는 차세대 인공지능 '제미니 3.5'를 출시했습니다.Vietnam.vn
2026. 5. 20. 오후 12:12

구글이 인간처럼 행동할 수 있는 차세대 인공지능 '제미니 3.5'를 출시했습니다.

AI모델에이전트멀티모달코드생성벤치마크안전성API구독서비스
오픈AI, ‘GPT-5.5’ 공개…IPO 앞두고 신모델 출시 경쟁 격화이투데이
2026. 4. 24. 오후 3:39

오픈AI, ‘GPT-5.5’ 공개…IPO 앞두고 신모델 출시 경쟁 격화

AI모델GPT성능향상벤치마크IPO코딩데이터분석안전성
오픈AI, GPT-5.5 공개…‘AI 슈퍼앱’ 시대 연다매일경제
2026. 4. 24. 오전 3:42

오픈AI, GPT-5.5 공개…‘AI 슈퍼앱’ 시대 연다

AI모델GPT코딩자동화성능향상API안전성벤치마크