article detail
미토스 이어 GPT-5.5도... 20시간짜리 해킹, AI가 혼자 해냈다
2026. 5. 2. 오후 1:33
AI 요약
영국 정부 산하 AI안전연구소(AISI)가 2026년 4월 발표한 보고서는 엔트로픽의 클로드 미토스 프리뷰와 오픈AI의 GPT-5.5가 숙련된 보안 전문가가 20시간은 걸린다고 추정되는 다단계 기업 네트워크 해킹 시나리오를 스스로 끝까지 수행했고, 이는 특정 모델의 특이 성과가 아니라 산업 전체의 진화 신호라고 결론 내렸습니다. 보고서는 GPT-5.5의 엑스퍼트급 성공률이 약 71%, 클로드 미토스는 약 68%로 이전 세대의 약 50%에서 크게 향상되었으나 TLO에서는 미토스가 10번 중 3번, GPT-5.5가 2번 성공했고 산업 제어 시스템 공격 시뮬레이션에서는 두 모델 모두 실패했다고 전했습니다. 또한 더 많은 계산 자원과 생각할 시간이 성공률을 높였고, 전문가들이 단 6시간 만에 GPT-5.5의 사이버 안전장치를 우회하는 유니버설 탈옥 방법을 찾아내 안전 설계의 취약성을 드러냈으며 영국 정부와 NCSC는 같은 기술을 방어에 활용하는 방안을 논의 중이라고 보고서는 밝혔습니다.
![[5월8일] 고블린 모드부터 '사마리자'까지...팬미팅 같은 오픈AI 'GPT-5.5 파티'](https://cdn.aitimes.com/news/photo/202605/210244_212849_467.png)





![[영상] '초지능 AI'의 서막? 전세계 강타한 미토스 정체](https://img2.yna.co.kr/etc/inner/KR/2026/04/30/AKR20260430194900797_01_i_P4.jpg)