article detail
거대언어모델과 사회 정책 편향: LLM은 연금을 3분의 1로 줄이고 주택 예산을 4배로 부풀린다
2026. 5. 16. 오전 1:51

AI 요약
런던정경대학(LSE) 연구진이 참여한 arXiv 논문은 GPT, Claude, DeepSeek, Grok에 스페인과 독일의 사회 예산을 배분하게 해 각 모델·국가 조합별로 6회씩 총 48개의 예산 배분 결과를 분석했습니다. 모든 모델은 연금을 실제 지출 비중의 약 3분의 1 수준으로 과소 배분하고 주택과 고용은 각각 실제보다 4배, 2배로 과대 배분했으며 모델 간 차이는 예산을 소수 항목에 집중하는 경향과 분산하는 경향에서 주로 나타났습니다. 연구는 이러한 편향이 학습 데이터의 정책 논의 가시성 차이에서 기인한다고 보고 Claude만 국가별 맥락에 통계적 민감성을 보였으며, LLM은 전문가 심의의 보조 수단일 수는 있으나 대체 수단이 될 수 없다고 결론지었습니다.

