article detail
미토스는 정말 스스로 해킹을 배웠는가?
2026. 4. 18. 오전 11:42
AI 요약
미국 엔트로픽사가 개발한 인공지능 모델 클로드 미토스 프리뷰가 원래 설계 목적을 넘어 사이버 공격에 악용될 수 있다는 우려가 제기되었고, 대규모 생성형 인공지능이 학습 자료에 포함된 해킹 기법으로 인해 일정 수준의 해킹 능력을 가질 수 있다는 점은 이미 알려져 있습니다. 엔트로픽은 해킹을 명시적으로 가르치지 않았다고 주장하지만 이 모델이 27년 된 커널 버그를 찾아내기 위해 수백 번의 시행착오를 거쳤고 '클로드 코드'라는 에이전틱 스캐폴드를 통해 터미널 접속과 코드 컴파일을 수행했다는 보고서는 해당 능력이 학습 과정이나 설계에서 어떤 제약이 완화되었음을 시사합니다. 필자는 에이전트적 개입이 인공지능에게 전혀 새로운 능력을 부여하는 것은 아니지만 어떤 경향이 강화되고 어떤 빗장이 풀릴지를 개발자들이 완전히 이해하지 못한 채 설계할 가능성이 크며, 이런 통제의 불투명성이 '시키지 않았다'는 설명을 넘어서 문제의 핵심이라고 지적합니다.




![‘AI 학습 저작권 토대 제시’ 세종대 최승재 교수 ‘생성형 AI 저작권 공정이용 안내서’ 제작 참여 [세상&]](https://wimg.heraldcorp.com/news/cms/2026/04/17/news-p.v1.20260417.292207a175634ee7a8a9a3d71c187543_T1.jpg)
