article detail
英 AI안전연 "클로드 미토스, 회사 네트워크 통째로 장악한 첫 AI"
2026. 4. 14. 오전 10:57

AI 요약
영국 AI 안전연구소(AISI)는 13일(현지 시간) 발표에서 앤트로픽의 AI 모델 '클로드 미토스 프리뷰'가 32단계 기업망 공격 시뮬레이션 '더 라스트 원스(TLO)'를 10번 시도 중 3번 완주해 평균 수행 단계 22단계를 기록하며 '클로드 오퍼스 4.6'(평균 16단계)과 오픈AI GPT-5.4(평균 약 14단계)보다 높은 성능을 보였다고 평가했습니다. 또 미토스 프리뷰는 전문가 난이도 CTF 과제에서 약 73% 성공률을 보였으나 AISI는 실험이 능동적 방어 요소 없이 보안이 취약한 환경에 한정됐다며 실제 공격력으로 확대 해석하기에는 추가 검증이 필요하다고 밝혔습니다. 미토스는 지난달 앤트로픽 내부 자료 유출로 존재가 알려졌고 앤트로픽은 지난 7일 '프로젝트 글래스윙'으로 공식 발표한 뒤 일반 공개를 하지 않고 일부 기업과 정부 기관에 제한적으로 제공하고 있으며 업계에서는 위험성 과도 부각 비판도 제기되고 있습니다.




![[AI돋보기] 27년 전 결함까지…'자율 해킹' AI 등장에 비상](https://stock.mk.co.kr/photos/20260415/AKR20260415038200017_01_i_P4.jpg)
