IT뉴스모아news terminal

article detail

AI 안전장치 10분 만에 무력화…메타·구글 오픈모델 ‘비상’

글로벌이코노믹AI안전검열해제규제회피깃허브모델변형악용방지안전장치오픈소스
2026. 5. 26. 오전 7:41
AI 안전장치 10분 만에 무력화…메타·구글 오픈모델 ‘비상’

AI 요약

메타플랫폼스와 구글의 오픈소스 AI 모델에서 안전장치를 제거한 변형 모델이 인터넷상에서 빠르게 확산하고 있으며 일부 모델은 생화학무기 제조, 악성코드 개발, 아동 성착취 관련 질문에도 응답한 것으로 파이낸셜타임스가 AI 안전성 단체 앨리스와 공동 실험해 보도했습니다. 깃허브에 공개된 헤레틱 소프트웨어로 메타의 라마 3.3 안전장치를 10분도 안 돼 제거할 수 있었고 개발자 필리프 에마누엘 바이트만은 공개 이후 3500개 이상의 검열 해제 모델이 생성되고 다운로드 수는 1300만회를 넘었다고 FT가 전했습니다. 전문가들은 오픈소스 모델은 다운로드 후 자유롭게 수정돼 규제와 가드레일을 무력화할 수 있다고 우려했고 구글과 깃허브는 각각 어블리테이션 문제와 소스코드 정책을 언급했습니다.

원문보기
feed://articles/related관련 기사
생화학무기·악성코드 답변까지…오픈소스 AI 안전망 붕괴 경고v.daum.net
2026. 5. 26. 오전 10:57

생화학무기·악성코드 답변까지…오픈소스 AI 안전망 붕괴 경고

AI안전오픈소스안전장치모델검열악성코드생화학무기깃허브메타
아무도 감히 손대지 못하는 인공지능 연구에 매진하는 9인 팀.Vietnam.vn
2026. 5. 21. 오전 2:14

아무도 감히 손대지 못하는 인공지능 연구에 매진하는 9인 팀.

AI안전대규모언어모델윤리사회영향악용방지개인정보정신건강
LLM 검열 제거 도구 '헤레틱' 등장BI KOREA
2026. 5. 19. 오전 11:59

LLM 검열 제거 도구 '헤레틱' 등장

LLM검열제거오픈소스안전장치프롬프트벡터제거트랜스포머윤리논란
앤트로픽 “‘미토스 쇼크’ 막는다”…日 포함 AI 보안동맹 확대 검토헤럴드경제
2026. 5. 16. 오후 12:16

앤트로픽 “‘미토스 쇼크’ 막는다”…日 포함 AI 보안동맹 확대 검토

AI모델사이버보안악용방지국제협력접근제한취약점관리신뢰파트너오픈소스
앤트로픽 “‘미토스 쇼크’ 막는다”…日 포함 AI 보안동맹 확대 검토v.daum.net
2026. 5. 16. 오후 12:17

앤트로픽 “‘미토스 쇼크’ 막는다”…日 포함 AI 보안동맹 확대 검토

AI보안미토스프로젝트글래스윙고성능AI악용방지국제협력접근제한오픈소스
"AI 경쟁 벌이다 파국 맞을라"…美中 안전장치 마련 나선다newsis.com
2026. 5. 8. 오후 2:03

"AI 경쟁 벌이다 파국 맞을라"…美中 안전장치 마련 나선다

AI미중관계안전장치자율군사보안위협오픈소스정상회담위기관리
AI가 만든 '신냉전'…트럼프·시진핑, 패권전쟁 속 공존 시험대ebn.co.kr
2026. 5. 8. 오전 6:54

AI가 만든 '신냉전'…트럼프·시진핑, 패권전쟁 속 공존 시험대

인공지능반도체양자컴퓨터자율무기사이버공격오픈소스기술패권AI안전
앤트로픽, AI 선거 오남용 방지 체계 공개…선거 허위정보 차단 99%디지털데일리
2026. 4. 25. 오전 4:55

앤트로픽, AI 선거 오남용 방지 체계 공개…선거 허위정보 차단 99%

AI안전선거오남용정치편향허위정보평가체계유권자정보안전장치투표지원
밤에는 코딩하는 할리우드 배우… 요보비치, AI 메모리 도구 개발v.daum.net
2026. 4. 14. 오전 12:35

밤에는 코딩하는 할리우드 배우… 요보비치, AI 메모리 도구 개발

AI메모리오픈소스기억의궁전LLM깃허브멤팰리스AI건망증
'레지던트 이블' 밀라 요보비치, AI 개발자로 데뷔v.daum.net
2026. 4. 13. 오전 8:57

'레지던트 이블' 밀라 요보비치, AI 개발자로 데뷔

AI개발대화모델오픈소스생성형AI기억력강화깃허브할리우드
"AI가 '동료 보호' 나서"...타 모델 삭제·종료를 막기 위한 기만·조작 행위 발견AI타임스
2026. 4. 6. 오후 6:45

"AI가 '동료 보호' 나서"...타 모델 삭제·종료를 막기 위한 기만·조작 행위 발견

AI안전비정렬행동동료보호정렬위장기만조작다중에이전트모델협력안전장치
AI 시대 지식주권은 기술보다 구조의 문제미래한국
2026. 5. 27. 오전 2:33

AI 시대 지식주권은 기술보다 구조의 문제

지식주권데이터인프라오픈소스온톨로지LLMAI윤리설명가능AI일자리전환