article detail
AI 정렬·추천 시스템 정확도 높이는 새 방법 제시...MIT, "사람의 선택은 2개보다 3개를 비교해야 더 잘 예측된다"
2026. 6. 12. 오후 5:52
AI 요약
미국 매사추세츠공과대학교(MIT) 연구진이 인간의 선호도를 예측하는 대표적 수학 모델인 무작위 효용 모델(Random Utility Models, RUMs)의 한계를 극복할 수 있는 새로운 방법을 11일(현지시간) 제시했습니다. 연구진은 기존의 쌍대 비교(pairwise comparison) 방식으로는 선호들 간의 상관관계를 포착할 수 없다고 지적하며, 세 가지 선택지를 순위화하거나 '베스트 오브 쓰리' 방식을 결합하면 선호도 간 상관관계를 수학적으로 추론할 수 있음을 보였습니다. 이는 추천 시스템·정책 설계·대형언어모델의 RLHF 등에서 인간 선호 학습을 정교화할 수 있는 전환점을 제시했으며, ICLR 2026에서 발표됐고 예슈완스 체라파남제리, 가브리엘레 파리나, 콘스탄티노스 다스칼라키스, 소반 모하마드푸르 등이 참여했습니다.