article detail
"국내 LLM 보안, 글로벌의 80% 수준"…탈옥·인젝션에 '취약'
2026. 4. 24. 오후 4:59
AI 요약
숭실대학교 AI안전성 연구센터 나현식 교수는 국내외 주요 LLM 20종을 모델 단독·API·클라우드 환경까지 포함해 총 1만1000건 이상의 공격 시나리오(유해 요청, 탈옥, 프롬프트 인젝션)로 평가했습니다. 평가 결과 해외 대형 모델이 유해 요청 대응에서 영어 기준 평균 91.0점(국내 65.1점), 한국어 기준 해외 67.2점·국내 59.9점을 기록했으며 국내 LLM의 보안 수준은 글로벌 대비 약 75~82%로 나타나고 프롬프트 인젝션은 대부분 모델이 취약했습니다. 또한 서비스 통합(API) 환경이 모델 단독보다 약 6% 더 안전했고 고성능 모델이 공격 프롬프트를 정교하게 생성해 다른 시스템 공격 도구로 활용될 가능성이 확인되어 운영상의 필터링·정책 레이어·모니터링이 보안 핵심임을 보여주었습니다.


![[WIS 2026] KT, AI 기반 기업보안 솔루션 공개](https://img.etnews.com/news/article/2026/04/24/news-p.v1.20260424.43db3b77ed6f4fe995ff8c8e192c9f42_P1.png)


![[에이전트와 보안②] AI 에이전트 보안 위협 현실화…메일 삭제부터 코드 실행까지](https://cdn.byline.network/wp-content/uploads/2026/04/AGENT2.jpg)