article detail
거대언어모델과 사회 정책 편향: LLM은 연금을 3분의 1로 줄이고 주택 예산을 4배로 부풀린다
2026. 5. 16. 오전 1:46
AI 요약
런던정경대학(LSE) 연구진이 참여한 arXiv 논문 Social Policy of Large Language Models: How GPT, Claude, DeepSeek and Grok Allocate Social Budgets in Spain and Germany에서 GPT, Claude, DeepSeek, Grok에게 스페인과 독일의 사회 예산을 모델·국가 조합별로 각 6회씩 질의해 총 48개의 배분 결과를 얻어 OECD 참고 예산과 비교한 결과 연금은 실제의 약 3분의 1로 과소 배분되고 주택은 4배, 고용은 2배로 과대 배분되었다고 밝혔습니다. 연구는 이 편향이 특정 지정학적 경향이 아니라 학습된 텍스트 내 정책 담론의 논의 밀도와 언어적 가시성 차이에서 비롯된 구조적 한계라고 해석했으며 Claude만이 국가별 맥락에 통계적으로 유의미한 민감성을 보였다고 지적했습니다. 연구팀은 LLM이 공공 예산 책정 과정에서 전문가 심의를 보조할 수는 있으나 대체할 수는 없고, 학습 데이터의 다양성 확보와 모델 산출물에 대한 이중 검증 체계 등 편향을 검증·교정하는 체계가 필요하다고 결론지었습니다.


