IT뉴스모아news terminal

article detail

나현식 숭실대 교수 “안전성 낮은 국내 LLM, 퍼플티밍으로 점검해야”

바이라인네트워크AI보안LLM레드티밍벤치마크생성형AI안전성검증퍼플티밍한국어특화

2026. 4. 16. 오후 11:44

나현식 숭실대 교수 “안전성 낮은 국내 LLM, 퍼플티밍으로 점검해야”

AI 요약

생성형 인공지능 도입으로 AI 보안의 초점이 악성 프롬프트 차단을 넘겨 LLM과 AI 서비스 전반의 안전성 선제 검증으로 이동하고 있으며, 나현식 숭실대학교 연구교수는 16일 열린 ‘제32회 정보통신망 정보보호 컨퍼런스(NetSec-KR) 2026’에서 LLM 보안은 레드티밍을 넘어 공격과 방어를 함께 돌리는 퍼플티밍 체계로 나아가야 한다고 말했습니다. 숭실대학교 AI안전성연구센터는 국내외 모델 20종(국내 10종·해외 10종)을 파운데이션 모델 단독 실행 환경과 API·AWS 등 서비스 통합 환경에서 영어·한국어로 시험해 7개 케이스, 57종 공격, 총 1만1350개 샘플로 검증한 결과 국내 LLM의 평균 보안·안전성 수준은 해외 모델의 약 82%였고 일부 서비스 통합 환경에서는 약 75% 수준으로 나타났습니다. 나 교수는 자동화 레드티밍의 한계와 루브릭 기반 평가자의 점수 변동성, 한국어 특화 레드티밍 벤치마크 부재 및 번역 문제 등 평가 방식의 과제를 지적하며 공격과 방어를 순환하는 퍼플티밍과 한국어에 맞는 벤치마크·평가 모델 마련의 필요성을 제기했습니다.

친사회성 역대 최고… 앤트로픽, ‘클로드 오푸스 4.8’ 출시

디지털 인사이트 DIGITAL iNSIGHT

2026. 5. 29. 오후 2:11

친사회성 역대 최고… 앤트로픽, ‘클로드 오푸스 4.8’ 출시

LLM생성형AI클로드할루시네이션에이전트코딩벤치마크

식약처, ‘첨단AI 의료제품 레드팀 챌린지’ 개최 확정

2026. 5. 22. 오후 12:35

식약처, ‘첨단AI 의료제품 레드팀 챌린지’ 개최 확정

의료AI레드팀생성형AI취약점AI보안시험평가규제LLM

식약처 '2026 첨단AI 의료제품 레드팀 챌린지' 9월 개최 확정

2026. 5. 21. 오후 3:53

식약처 '2026 첨단AI 의료제품 레드팀 챌린지' 9월 개최 확정

AI의료제품레드팀챌린지생성형AI의료AIAI보안시험평가LLM취약점분석

TTA, AI 보안 표준 개발 착수…전문가 프로젝트그룹 출범

2026. 5. 21. 오후 3:28

TTA, AI 보안 표준 개발 착수…전문가 프로젝트그룹 출범

AI보안생성형AI표준화AI에이전트위협대응딥페이크LLM신뢰성

TTA, AI 보안 표준 개발 착수…전문가 프로젝트그룹 출범

2026. 5. 21. 오후 3:31

TTA, AI 보안 표준 개발 착수…전문가 프로젝트그룹 출범

AI보안생성형AI표준화AI에이전트위협탐지딥페이크LLM국제표준

셀렉트스타, 클로드·챗GPT 취약점 찾아내는 AI 레드티밍 기술력 '인정'

2026. 5. 14. 오후 3:20

셀렉트스타, 클로드·챗GPT 취약점 찾아내는 AI 레드티밍 기술력 '인정'

LLM레드티밍취약점탐지자연어처리AI안전언어모델공격성공률벤치마크

솔트웨어, ‘사피가디언’ 중심의 생성형 AI 보안 전략 제시

2026. 5. 8. 오전 10:45

솔트웨어, ‘사피가디언’ 중심의 생성형 AI 보안 전략 제시

생성형AIAI보안DLP데이터보안LLM프롬프트제어민감정보보호엔드투엔드

솔트웨어, ‘제9회 국제인공지능대전’ 참가…‘사피가디언’ 중심 시장 공략 본격화

아이티데일리

2026. 5. 7. 오전 10:48

솔트웨어, ‘제9회 국제인공지능대전’ 참가…‘사피가디언’ 중심 시장 공략 본격화

생성형AIDLP데이터보안AI보안LLM프롬프트제어데이터필터링정책관리

금감원, 금융권 블라인드 모의해킹 연 2회로 확대…'미토스' 등 AI 위협 대응

아시아경제

2026. 4. 30. 오전 6:00

금감원, 금융권 블라인드 모의해킹 연 2회로 확대…'미토스' 등 AI 위협 대응

금융보안모의해킹AI보안레드티밍생성형AIDDoS취약점분석사이버위협

에이아이웍스, 에이전트 신뢰성 검증 솔루션 ‘에이전트리거’ 출시

2026. 4. 28. 오후 3:20

에이아이웍스, 에이전트 신뢰성 검증 솔루션 ‘에이전트리거’ 출시

AI에이전트신뢰성검증솔루션LLM평가컴플라이언스벤치마크한국어특화안전성검증

오픈AI, 에이전트 능력서 '미소스' 꺾은 GPT-5.5 출시...세계 1위 탈환

2026. 4. 24. 오전 7:12

오픈AI, 에이전트 능력서 '미소스' 꺾은 GPT-5.5 출시...세계 1위 탈환

생성형AILLM에이전트벤치마크API멀티모달추론능력토큰가격

오픈AI, ‘GPT-5.5’ 공개⋯"알아서 일하는 AI 등장"

브릿지경제

2026. 4. 24. 오전 6:44

오픈AI, ‘GPT-5.5’ 공개⋯"알아서 일하는 AI 등장"

생성형AILLM에이전트AIAI모델자동화API벤치마크