article detail
"협동 AI 중 하나 고장 나도 임무 이어가는 강화학습법 개발"
2026. 6. 24. 오전 11:47

AI 요약
울산과학기술원(UNIST) 인공지능대학원 한승열 교수팀은 AI 에이전트 간 협력 고리를 일부러 끊으면서 훈련하는 다중 에이전트 강화 학습 기술인 상호작용 차단 적대 학습(IBAL)을 개발했다고 24일 밝혔습니다. IBAL은 학습 과정에서 AI를 두 그룹으로 나누고 상호 정보량으로 중요한 정보를 찾아 가려 협력을 깨뜨리며 그룹 구성을 무작위로 바꾸고 공격 강도를 조절해 일부 에이전트가 멈추거나 통신이 끊겨도 남은 에이전트들이 새로운 협력 방식을 찾아 임무를 이어가도록 설계되었습니다. 스타크래프트2 기반 실험에서 기존 모델들은 팀원 결손 시 일부 모델 승률이 13.3%까지 떨어졌으나 IBAL로 학습한 모델은 87.0%의 승률을 기록했으며 연구 결과는 국제머신러닝학회(ICML)에 채택됐습니다.