IT뉴스모아news terminal

article detail

中 상하이자오퉁대, ‘AI 모델이 다른 AI 모델 비판’ 자율연구 시스템 개발

로봇신문AI에이전트LLM다중에이전트상호검증연구자동화오픈소스자율연구적대적검증

2026. 5. 25. 오후 8:14

中 상하이자오퉁대, ‘AI 모델이 다른 AI 모델 비판’ 자율연구 시스템 개발

AI 요약

중국 상하이자오퉁대 연구팀이 대규모언어모델(LLM) 에이전트들이 서로를 적대적으로 비판하며 연구 전 과정을 자동화하는 오픈소스 시스템 ARIS(Autonomous Research via Adversarial Multi-Agent Collaboration)를 개발해 arXiv에 논문(ARIS: Autonomous Research via Adversarial Multi-Agent Collaboration)을 발표했습니다. ARIS는 실행자와 검토자를 반드시 다른 모델 계열에서 선택해 상호검증하고, 1단계에서 평가 코드와 결과물의 무결성을 검사하며, 2단계에서 실험 결과를 '지지·부분적 지지·무효'로 판정하고, 3단계에서 새로운 검토 모델이 논문 초안의 수치 주장을 원본 결과 파일과 대조하는 절차로 '그럴듯하지만 근거 없는 성공' 문제를 완화하려 하며, 연구 방향 설정·증거 검증·최종 제출 결정은 여전히 인간의 책임으로 남겨두고 Claude Code, Codex CLI, Cursor 등 환경에서 동작하는 것으로 확인됐습니다.

연구행정에 AI 도입 속도···"7.8만장 문서 학습 LLM으로 AI 서비스까지"

2026. 5. 14. 오후 5:36

연구행정에 AI 도입 속도···"7.8만장 문서 학습 LLM으로 AI 서비스까지"

LLM거대언어모델AI에이전트연구행정문서학습업무자동화도메인지식오픈소스

AI 분야 국제학술대회 3곳서 '엄지척'…논문 3편 올린 K스타트업

유니콘팩토리

2026. 5. 8. 오전 8:00

AI 분야 국제학술대회 3곳서 '엄지척'…논문 3편 올린 K스타트업

AI에이전트다중에이전트LLM학술논문국제학술대회추론기술데이터과학코드합성

카카오, 플레이MCP에 오픈클로 연동…AI 에이전트 활용성 확대

2026. 5. 3. 오전 11:21

카카오, 플레이MCP에 오픈클로 연동…AI 에이전트 활용성 확대

AI에이전트MCP오픈소스플랫폼연동자동화LLMAPI연결

카카오, AI 도구함 확대⋯AI 에이전트 '오픈클로' 연동 지원

2026. 5. 2. 오전 5:51

카카오, AI 도구함 확대⋯AI 에이전트 '오픈클로' 연동 지원

AI에이전트플랫폼도구연동자동화오픈소스MCPLLM인증

카카오, '플레이MCP'에 오픈소스 AI 에이전트 '오픈클로' 연동

2026. 5. 1. 오전 10:46

카카오, '플레이MCP'에 오픈소스 AI 에이전트 '오픈클로' 연동

AI에이전트오픈소스MCP서버LLM카카오톡API연동개발자플랫폼보안토큰

스프링 창시자, 자바 AI에이전트 프레임워크 '엠바벨' 공개...파이썬 계열과 경쟁

디지털투데이

2026. 4. 25. 오전 8:18

스프링 창시자, 자바 AI에이전트 프레임워크 '엠바벨' 공개...파이썬 계열과 경쟁

자바AI에이전트프레임워크오픈소스LLM엔터프라이즈생성형AI파이썬

“나만의 AI 에이전트, 뚝딱” 엔비디아 ‘빌드 어 클로’ 가보니

2026. 4. 21. 오후 4:34

“나만의 AI 에이전트, 뚝딱” 엔비디아 ‘빌드 어 클로’ 가보니

AI에이전트오픈소스보안강화추론토큰LLM슈퍼컴퓨터공공데이터

“나만의 AI 에이전트, 뚝딱” 엔비디아 ‘빌드 어 클로’ 가보니

2026. 4. 21. 오후 4:33

“나만의 AI 에이전트, 뚝딱” 엔비디아 ‘빌드 어 클로’ 가보니

AI에이전트오픈클로엔비디아네모클로LLM보안오픈소스토큰최적화

"클릭 몇 번으로 AI 에이전트 구축"…카페24 '오픈클로 VPS' 출시

2026. 4. 8. 오전 9:37

"클릭 몇 번으로 AI 에이전트 구축"…카페24 '오픈클로 VPS' 출시

AI에이전트오픈소스VPSLLM서버구축자동화보안강화한국어지원

서울대 찾은 젠슨 황 "K만 붙이면 유명해진다…나는 K-젠슨"

연합인포맥스

2026. 6. 8. 오후 1:01

서울대 찾은 젠슨 황 "K만 붙이면 유명해진다…나는 K-젠슨"

AI엔비디아칩설계LLM오픈소스로봇에이전트신약개발

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증" — IT뉴스모아

news.dlwlrmaon.com

2026. 6. 3. 오후 6:03

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증" — IT뉴스모아

LLM벤치마크안전성다국어문화민감성오픈소스평가도구언어모델

"금융 AI에이전트 시대 선도할 것…AI 매출 5년 내 기존 CMS 사업 추월"

2026. 6. 7. 오전 10:00

"금융 AI에이전트 시대 선도할 것…AI 매출 5년 내 기존 CMS 사업 추월"

AI에이전트금융AILLM자연어처리데이터분석ERP뱅킹서비스AI전환