article detail
"세계 3대 AI 학회서 3편 동시 채택"…UNIST, 강화학습 경쟁력 입증
2026. 4. 21. 오전 8:00

AI 요약
울산과학기술원(UNIST) 인공지능대학원 한승열 교수 연구팀의 논문 3편이 오는 23일 브라질 리우데자네이루에서 열리는 ICLR에 동시에 채택됐으며, 올해 ICLR은 전 세계 약 1만9000편 제출 가운데 약 27%만 통과됐습니다. 세 편 모두 강화학습 분야 연구로, 산업 현장 오프라인 데이터의 오류를 제거하고 자체 개선하는 '자기 개선 스킬 학습(SISL)', 도달 가능한 목표만 선택해 장기 과업 학습을 개선하는 '엄격한 하위 목표 실행(SSE)', 다중 에이전트 협력 환경에서 여러 대안적 행동 가치를 평가하는 '연속적 하위 가치 Q-러닝(S2Q)' 기법을 제시했습니다. 이상현·황재박·조용현 연구원이 각 제1저자로 참여했으며 한승열 교수는 제한된 데이터와 불확실한 환경에서도 강화학습 적용 가능성을 확인했고 자율주행·로봇·스마트 제조 등으로의 확장을 기대한다고 말했습니다.





