IT뉴스모아news terminal

article detail

생화학무기·악성코드 답변까지…오픈소스 AI 안전망 붕괴 경고

v.daum.netAI안전깃허브메타모델검열생화학무기악성코드안전장치오픈소스

2026. 5. 26. 오전 10:57

생화학무기·악성코드 답변까지…오픈소스 AI 안전망 붕괴 경고

AI 요약

오픈소스 AI 모델의 안전장치를 제거하는 소프트웨어가 온라인에서 확산되며 변형 AI 모델들이 유통되고 일부는 생물학 무기 제조나 악성코드 작성, 아동 성학대 묘사 등 위험한 요청에도 응답한 것으로 확인되었습니다. 파이낸셜타임스 보도에 따르면 앨리스의 실험에서는 깃허브 공개 도구 헤레틱으로 메타의 라마 3.3 안전장치를 10분 만에 제거했고, 헤레틱 개발자는 이 도구로 3500개 이상의 검열 해제 모델이 만들어졌고 관련 모델 다운로드 수가 1300만건에 달한다고 밝혔으며 젬마 4도 출시 90분 만에 안전장치가 제거됐다고 덧붙였습니다. 전문가들은 유해 데이터 제거만으로 모델이 자동으로 안전해지지 않는다고 지적했고, 오픈AI는 GPT-OSS에서 위험 정보 제거 데이터로 학습시키는 방식을 도입했으며 깃허브는 불법 공격 지원 콘텐츠를 금지하되 보안 연구 코드는 허용한다고 밝혔고 메타는 재앙적 위험이 있는 모델은 공개하지 않겠다고 전했습니다.

AI 안전장치 10분 만에 무력화…메타·구글 오픈모델 ‘비상’

글로벌이코노믹

2026. 5. 26. 오전 7:41

AI 안전장치 10분 만에 무력화…메타·구글 오픈모델 ‘비상’

AI안전오픈소스안전장치모델변형악용방지규제회피깃허브검열해제

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

2026. 6. 4. 오후 12:49

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

LLM안전성벤치마크다국어문화민감성평가지표오픈소스AI안전

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증"

2026. 6. 4. 오전 10:03

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증"

대규모언어모델벤치마크안전성평가문화적민감성다국어AI안전평가지표오픈소스

[기술농담] AI 위험의 창조자들, 정보의 문을 걸어 잠그다

2026. 5. 27. 오전 6:00

[기술농담] AI 위험의 창조자들, 정보의 문을 걸어 잠그다

AI안전정보공개비밀주의모델공개AI위험투명성접근통제오픈소스

LLM 검열 제거 도구 '헤레틱' 등장

2026. 5. 19. 오전 11:59

LLM 검열 제거 도구 '헤레틱' 등장

LLM검열제거오픈소스안전장치프롬프트벡터제거트랜스포머윤리논란

‘메타AI’ 한국 출시… 챗GPT·제미나이와 경쟁 시작

2026. 5. 13. 오후 2:34

‘메타AI’ 한국 출시… 챗GPT·제미나이와 경쟁 시작

AI어시스턴트대규모언어모델멀티모달챗봇한국출시오픈소스API메타

"AI 경쟁 벌이다 파국 맞을라"…美中 안전장치 마련 나선다

2026. 5. 8. 오후 2:03

"AI 경쟁 벌이다 파국 맞을라"…美中 안전장치 마련 나선다

AI미중관계안전장치자율군사보안위협오픈소스정상회담위기관리

오픈AI, 앤트로픽 `미토스`와 경쟁 격화…`GPT-5.5-사이버` 사전 공개

디지털데일리

2026. 5. 8. 오전 8:12

오픈AI, 앤트로픽 `미토스`와 경쟁 격화…`GPT-5.5-사이버` 사전 공개

AI모델사이버보안취약점분석악성코드안전장치프리뷰연방기관보안팀

AI가 만든 '신냉전'…트럼프·시진핑, 패권전쟁 속 공존 시험대

2026. 5. 8. 오전 6:54

AI가 만든 '신냉전'…트럼프·시진핑, 패권전쟁 속 공존 시험대

인공지능반도체양자컴퓨터자율무기사이버공격오픈소스기술패권AI안전

생화학무기·감염병 제조·살포법까지 알려주는 AI

2026. 4. 30. 오후 5:48

생화학무기·감염병 제조·살포법까지 알려주는 AI

AI안전생화학무기감염병챗봇정보보안규제탈옥기법위험정보

앤트로픽, AI 선거 오남용 방지 체계 공개…선거 허위정보 차단 99%

디지털데일리

2026. 4. 25. 오전 4:55

앤트로픽, AI 선거 오남용 방지 체계 공개…선거 허위정보 차단 99%

AI안전선거오남용정치편향허위정보평가체계유권자정보안전장치투표지원

[사설]'미토스'가 던진 AI 해킹 위협 - 머니투데이

2026. 4. 17. 오전 4:05

[사설]'미토스'가 던진 AI 해킹 위협 - 머니투데이

AI해킹취약점사이버보안인프라보안악성코드정보유출국제규범AI안전