article detail
"세계 3대 AI 학회서 3편 동시 채택"…UNIST, 강화학습 경쟁력 입증
2026. 4. 21. 오전 8:00
AI 요약
울산과학기술원(UNIST) 인공지능대학원 한승열 교수 연구팀의 논문 3편이 오는 23일 브라질 리우데자네이루에서 열리는 표현학습국제학회(ICLR)에 동시 채택됐으며 ICLR에는 전 세계에서 약 1만9000편이 제출돼 이 중 약 27%만 통과했습니다. 세 편 모두 강화학습 분야 논문으로, 산업용 오프라인 데이터의 오류를 제거해 안정적 학습을 가능하게 하는 '자기 개선 스킬 학습(SISL)', 도달 가능한 목표만 선택해 장기 과업의 학습 성공률과 속도를 개선하는 '엄격한 하위 목표 실행(SSE)', 다중 에이전트 환경에서 여러 대안적 행동 가치를 평가해 유연한 의사결정을 가능하게 하는 '연속적 하위 가치 Q-러닝(S2Q)' 기법을 제시했습니다. 제1저자는 이상현·황재박·조용현 연구원이며 한승열 교수는 제한된 데이터와 불확실한 환경에서도 강화학습을 안정적으로 적용할 수 있는 가능성을 확인했다며 자율주행·로봇·스마트 제조 등 다양한 산업 분야로의 확장을 기대한다고 밝혔습니다.






