IT뉴스모아news terminal

article detail

中 상하이자오퉁대, ‘AI 모델이 다른 AI 모델 비판’ 자율연구 시스템 개발

로봇신문AI에이전트LLM다중에이전트상호검증연구자동화오픈소스자율연구적대적검증
2026. 5. 25. 오후 8:14
中 상하이자오퉁대, ‘AI 모델이 다른 AI 모델 비판’ 자율연구 시스템 개발

AI 요약

중국 상하이자오퉁대 연구팀이 대규모언어모델(LLM) 에이전트들이 서로를 적대적으로 비판하며 연구 전 과정을 자동화하는 오픈소스 시스템 ARIS(Autonomous Research via Adversarial Multi-Agent Collaboration)를 개발해 arXiv에 논문(ARIS: Autonomous Research via Adversarial Multi-Agent Collaboration)을 발표했습니다. ARIS는 실행자와 검토자를 반드시 다른 모델 계열에서 선택해 상호검증하고, 1단계에서 평가 코드와 결과물의 무결성을 검사하며, 2단계에서 실험 결과를 '지지·부분적 지지·무효'로 판정하고, 3단계에서 새로운 검토 모델이 논문 초안의 수치 주장을 원본 결과 파일과 대조하는 절차로 '그럴듯하지만 근거 없는 성공' 문제를 완화하려 하며, 연구 방향 설정·증거 검증·최종 제출 결정은 여전히 인간의 책임으로 남겨두고 Claude Code, Codex CLI, Cursor 등 환경에서 동작하는 것으로 확인됐습니다.

원문보기
feed://articles/related관련 기사
연구행정에 AI 도입 속도···"7.8만장 문서 학습 LLM으로 AI 서비스까지"이데일리
2026. 5. 14. 오후 5:36

연구행정에 AI 도입 속도···"7.8만장 문서 학습 LLM으로 AI 서비스까지"

LLM거대언어모델AI에이전트연구행정문서학습업무자동화도메인지식오픈소스
AI 분야 국제학술대회 3곳서 '엄지척'…논문 3편 올린 K스타트업유니콘팩토리
2026. 5. 8. 오전 8:00

AI 분야 국제학술대회 3곳서 '엄지척'…논문 3편 올린 K스타트업

AI에이전트다중에이전트LLM학술논문국제학술대회추론기술데이터과학코드합성
카카오, 플레이MCP에 오픈클로 연동…AI 에이전트 활용성 확대v.daum.net
2026. 5. 3. 오전 11:21

카카오, 플레이MCP에 오픈클로 연동…AI 에이전트 활용성 확대

AI에이전트MCP오픈소스플랫폼연동자동화LLMAPI연결
카카오, AI 도구함 확대⋯AI 에이전트 '오픈클로' 연동 지원v.daum.net
2026. 5. 2. 오전 5:51

카카오, AI 도구함 확대⋯AI 에이전트 '오픈클로' 연동 지원

AI에이전트플랫폼도구연동자동화오픈소스MCPLLM인증
카카오, '플레이MCP'에 오픈소스 AI 에이전트 '오픈클로' 연동뉴시스
2026. 5. 1. 오전 10:46

카카오, '플레이MCP'에 오픈소스 AI 에이전트 '오픈클로' 연동

AI에이전트오픈소스MCP서버LLM카카오톡API연동개발자플랫폼보안토큰
스프링 창시자, 자바 AI에이전트 프레임워크 '엠바벨' 공개...파이썬 계열과 경쟁디지털투데이
2026. 4. 25. 오전 8:18

스프링 창시자, 자바 AI에이전트 프레임워크 '엠바벨' 공개...파이썬 계열과 경쟁

자바AI에이전트프레임워크오픈소스LLM엔터프라이즈생성형AI파이썬
“나만의 AI 에이전트, 뚝딱” 엔비디아 ‘빌드 어 클로’ 가보니v.daum.net
2026. 4. 21. 오후 4:34

“나만의 AI 에이전트, 뚝딱” 엔비디아 ‘빌드 어 클로’ 가보니

AI에이전트오픈소스보안강화추론토큰LLM슈퍼컴퓨터공공데이터
“나만의 AI 에이전트, 뚝딱” 엔비디아 ‘빌드 어 클로’ 가보니경향신문
2026. 4. 21. 오후 4:33

“나만의 AI 에이전트, 뚝딱” 엔비디아 ‘빌드 어 클로’ 가보니

AI에이전트오픈클로엔비디아네모클로LLM보안오픈소스토큰최적화
"클릭 몇 번으로 AI 에이전트 구축"…카페24 '오픈클로 VPS' 출시뉴스1
2026. 4. 8. 오전 9:37

"클릭 몇 번으로 AI 에이전트 구축"…카페24 '오픈클로 VPS' 출시

AI에이전트오픈소스VPSLLM서버구축자동화보안강화한국어지원
DMind AI, Web3 특화 LLM 벤치마크 연구 공개네이트
2026. 5. 26. 오후 3:48

DMind AI, Web3 특화 LLM 벤치마크 연구 공개

LLM벤치마크Web3블록체인스마트컨트랙트DeFi오픈소스금융
Web3 특화 AI 벤치마크 'DMind Benchmark', KDD 2026 공식 채택네이트
2026. 5. 26. 오후 2:50

Web3 특화 AI 벤치마크 'DMind Benchmark', KDD 2026 공식 채택

Web3AI벤치마크블록체인LLM스마트컨트랙트학술대회오픈소스평가체계
Web3 특화 AI 벤치마크 'DMind Benchmark', KDD 2026 공식 채택네이트
2026. 5. 26. 오후 2:50

Web3 특화 AI 벤치마크 'DMind Benchmark', KDD 2026 공식 채택

AI벤치마크Web3블록체인LLM스마트컨트랙트오픈소스학술대회성능평가