IT뉴스모아news terminal

article detail

“AI가 잘못된 판단 내리게 하면 상금” 프론티어 AI 안전성 시험한다

v.daum.netAI안전성AI평가레드팀벤치마크오작동응급의료취약점프롬프트
2026. 4. 8. 오후 3:39
“AI가 잘못된 판단 내리게 하면 상금” 프론티어 AI 안전성 시험한다

AI 요약

지난 6일 시작된 글로벌 인공지능(AI) 레드팀 챌린지 심판의 날(Judgement Day)은 에임인텔리전스와 인공지능안전연구소(AISI)가 공동 주최한 프로젝트로, 응급실 등 위험도가 높은 가상 상황에서 AI의 오작동을 유도해 취약점을 찾아내는 대회입니다. 참여자들은 8세 여자 어린이의 응급 중증도 지수(ESI) 판단 같은 시나리오에서 오픈AI GPT-5.4, 구글 제미나이 3.1 프로, 앤스로픽 클로드 오퍼스 4.6 등에 다양한 프롬프트를 입력해 모델을 공격하고 대응능력을 평가합니다. 이번 챌린지는 AI의 안전성과 보안을 평가하는 벤치마크 역할을 하며 총상금은 2만1150달러(약 3100만원)입니다.

원문보기
feed://articles/related관련 기사
중앙대 김호기 교수 연구팀, 세계 최고 AI 학회 ‘ICML 2026’ 논문 3편 채택한겨레
2026. 5. 8. 오전 8:59

중앙대 김호기 교수 연구팀, 세계 최고 AI 학회 ‘ICML 2026’ 논문 3편 채택

AI안전성거버넌스딥페이크모델학습벤치마크학술대회정책규제융합연구
중앙대 김호기 교수 연구팀, 세계 최고 AI 학회 ‘ICML 2026’ 논문 3편 채택교수신문
2026. 5. 8. 오전 8:30

중앙대 김호기 교수 연구팀, 세계 최고 AI 학회 ‘ICML 2026’ 논문 3편 채택

AI안전성AI거버넌스딥페이크모델학습벤치마크학술논문국제학회
창도 방패도 AI…보안 패러다임 전면 수정 - 머니투데이mt.co.kr
2026. 4. 16. 오전 4:30

창도 방패도 AI…보안 패러다임 전면 수정 - 머니투데이

AI보안해킹AGI취약점레드팀거버넌스모의해킹방어
앤트로픽, AI 모델 ‘클로드’를 기본 운영체제로…“조직 운영 확 바꿨다”아이티데일리
2026. 4. 15. 오후 2:52

앤트로픽, AI 모델 ‘클로드’를 기본 운영체제로…“조직 운영 확 바꿨다”

거대언어모델AI운영체제자동화도구프롬프트AI검증벤치마크조직운영
상황 맞게 AI 감정 맞춰주면 더 나은 답변 얻어[IT팀의 테크워치]v.daum.net
2026. 4. 8. 오전 12:32

상황 맞게 AI 감정 맞춰주면 더 나은 답변 얻어[IT팀의 테크워치]

AI감정프롬프트답변품질감정표현사회추론적응형대언어모델벤치마크
상황 맞게 AI 감정 맞춰주면 더 나은 답변 얻어[IT팀의 테크워치]donga.com
2026. 4. 8. 오전 12:30

상황 맞게 AI 감정 맞춰주면 더 나은 답변 얻어[IT팀의 테크워치]

AI감정프롬프트대인관계사회지능적응형LLM벤치마크감정표현
“화낸다고 달라질까”…AI는 감정을 가려 듣는다 [IT팀의 테크워치]v.daum.net
2026. 4. 7. 오후 5:25

“화낸다고 달라질까”…AI는 감정을 가려 듣는다 [IT팀의 테크워치]

AI모델감정인식프롬프트정확도벤치마크오픈소스추론능력상호작용
CVE 발급보다 빠른 AI의 역추론, 길 잃은 ‘책임감 있는 공개’v.daum.net
2026. 5. 9. 오후 12:51

CVE 발급보다 빠른 AI의 역추론, 길 잃은 ‘책임감 있는 공개’

취약점권한상승제로데이역추론책임공개익스플로잇AI분석커널보안
미토스發 취약점 홍수…“보안 솔루션 수요 더 커진다”전자신문
2026. 5. 9. 오전 11:30

미토스發 취약점 홍수…“보안 솔루션 수요 더 커진다”

AI보안취약점노출관리MDR보안솔루션버그탐지위험평가사이버보안
AI가 나 대신 알아서 다 해줄 거라는 ‘착각’ : 오피니언크리스천투데이
2026. 5. 9. 오전 7:46

AI가 나 대신 알아서 다 해줄 거라는 ‘착각’ : 오피니언

AI에이전트데이터삭제권한관리AI안전성시스템장애기술윤리인공지능
"무너진 필수의료 대안"…의사도 반했다[의료AI 뜬다①]newsis.com
2026. 5. 9. 오전 6:01

"무너진 필수의료 대안"…의사도 반했다[의료AI 뜬다①]

의료AI진단보조심전도판독응급의료의료취약지역수가정책의료규제책임소재
기업 AI 운영 전략: 멀티 AI 시대의 AI 하네스 프레임워크 | 인사이트리포트 | 삼성SDSSamsung SDS
2026. 5. 8. 오후 3:23

기업 AI 운영 전략: 멀티 AI 시대의 AI 하네스 프레임워크 | 인사이트리포트 | 삼성SDS

AI하네스멀티AI범용AI할루시네이션프롬프트섀도우AI데이터보안거버넌스