IT뉴스모아news terminal

article detail

검증 모델 부족해 확산 제약…정부, AI 에이전트·MCP 안전망 만든다

지디넷코리아AI에이전트MCP검증체계벤치마크성능평가신뢰성안전성정부지원
2026. 5. 11. 오후 4:03
검증 모델 부족해 확산 제약…정부, AI 에이전트·MCP 안전망 만든다

AI 요약

과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 인공지능 에이전트 성능 평가·벤치마크와 모델 컨텍스트 프로토콜(MCP) 안전·신뢰 검증 체계를 올해 안에 구축하기로 하고 정부출연금 18억원을 투입해 협약 체결일부터 오는 12월 31일까지 진행하는 사업 공모를 사전 공개했습니다. 사업은 AI 에이전트 성능 평가 프레임워크(과업 성공률·도구 호출 정확도·실행 효율성 등), 다단계 추론 시나리오와 5000건 이상 검증 데이터셋을 포함한 벤치마크 도구(규칙 기반 자동 채점 및 실행 경로 기반 논리적 타당성 평가 등), 표준 적합성·상호운용성·안정성·보안성 등을 검증하는 MCP 검증 프레임워크 등 세 축으로 구성됩니다. 선정 수행기관은 개발 결과물을 최소 5년간 유지·운영해야 하며 과기정통부와 NIA는 오는 27일 오후 2시 서울 중구 NIA 서울사무소에서 사업설명회를 열 예정이고 사전공개 단계여서 세부 내용은 본 공고 시 변경될 수 있습니다.

원문보기
feed://articles/related관련 기사
복잡한 과학 연구에선 과학자 못따라잡는 AIv.daum.net
2026. 4. 14. 오후 3:04

복잡한 과학 연구에선 과학자 못따라잡는 AI

AI에이전트과학연구성능평가자연과학벤치마크AI활용연구품질
프롬프트 넘어 하네스로…‘기업 AI’ 새 국면이데일리
2026. 5. 11. 오후 4:51

프롬프트 넘어 하네스로…‘기업 AI’ 새 국면

기업AI거대언어모델AI하네스AI에이전트데이터관리프로세스자동화검증체계가드레일
앤서와이즈 AXIS 모델, K-AI 리더보드 3위·7위 동시 진입전자신문
2026. 5. 11. 오후 4:19

앤서와이즈 AXIS 모델, K-AI 리더보드 3위·7위 동시 진입

언어모델한국어AI벤치마크리더보드성능평가에이전트
NHN KCP, AI 기반 MCP 서버 도입… AI 결제 개발 시대 연다뉴스와이어
2026. 5. 8. 오전 9:00

NHN KCP, AI 기반 MCP 서버 도입… AI 결제 개발 시대 연다

AI결제MCP자동코딩결제연동AI에이전트표준화개발환경온보딩
AI 쓰려다 ‘복붙 노예’ 됐다? PC 조종하는 클로드 사용법v.daum.net
2026. 5. 8. 오전 5:02

AI 쓰려다 ‘복붙 노예’ 됐다? PC 조종하는 클로드 사용법

AI에이전트PC제어자동화데이터처리OCR업무자동화안전성
[Tech & Now] 달파, 오픈AI 'MLE-벤치'서 종합 점수 79.11% 기록ebn.co.kr
2026. 5. 7. 오후 4:14

[Tech & Now] 달파, 오픈AI 'MLE-벤치'서 종합 점수 79.11% 기록

AI에이전트벤치마크월드모델자율시스템머신러닝기술성과물류최적화마케팅자동화
달파, 오픈AI의 ‘MLE-벤치’서 글로벌 최고 수준 에이전트 성능 입증AI타임스
2026. 5. 7. 오후 4:35

달파, 오픈AI의 ‘MLE-벤치’서 글로벌 최고 수준 에이전트 성능 입증

AI에이전트벤치마크자율탐색자가개선월드모델에이전틱OS소비재브랜드
달파, 오픈AI 'MLE-벤치'서 글로벌 최고 수준 에이전트 성능 입증전자신문
2026. 5. 7. 오후 12:32

달파, 오픈AI 'MLE-벤치'서 글로벌 최고 수준 에이전트 성능 입증

AI에이전트성능평가월드모델자율탐색자가개선에이전틱OS소비재물류최적화
NVIDIA·ServiceNow, 기업용 자율 AI 에이전트 파트너십 확장NVIDIA Blog Korea
2026. 5. 7. 오후 12:24

NVIDIA·ServiceNow, 기업용 자율 AI 에이전트 파트너십 확장

AI에이전트자율시스템엔터프라이즈파트너십가속컴퓨팅거버넌스오픈모델벤치마크
난립하는 AI 모델, 한곳에서 몰아서 쓰자... 멀티AI 에이전트 전성시대디일렉
2026. 5. 6. 오후 2:25

난립하는 AI 모델, 한곳에서 몰아서 쓰자... 멀티AI 에이전트 전성시대

AI에이전트멀티AI플랫폼오케스트레이션MCP오픈소스보안협업도구
'AI 어떻게 믿지?'…와이즈스톤, 국제인공지능대전서 AI 품질 서비스 공개전자신문
2026. 5. 4. 오전 9:04

'AI 어떻게 믿지?'…와이즈스톤, 국제인공지능대전서 AI 품질 서비스 공개

AI품질신뢰성안전성인증서비스데이터품질품질검증AI모델시험성적서
카카오 ‘PlayMCP’, 오픈소스 AI 에이전트 '오픈클로' 연동 지원...200여 개 MCP 서버 등인공지능신문
2026. 5. 3. 오후 5:39

카카오 ‘PlayMCP’, 오픈소스 AI 에이전트 '오픈클로' 연동 지원...200여 개 MCP 서버 등

MCPAI에이전트오픈소스API연동자동화로컬모델생태계플랫폼