article detail
LLM, 연금은 3분의 1로 줄이고 주택은 4배 부풀려…사회 예산 편향 실증
2026. 5. 16. 오전 1:43
AI 요약
런던정경대학(LSE) 연구진이 포함된 국제 연구팀이 발표한 arXiv 논문은 대표적 거대언어모델(Claude, GPT-4o, DeepSeek, Grok)이 유럽의 실제 사회 지출과 달리 연금을 실제 지출의 약 3분의 1로 과소 배분하고 주택은 약 4배, 고용은 약 2배 과대 배분한다고 수치로 입증했습니다. 연구팀은 스페인과 독일을 대상으로 각 모델·국가 조합에 동일 프롬프트를 6회씩 적용해 총 48개의 할당 결과를 OECD 기준 예산과 비교한 결과, 모든 LLM이 일관된 암묵적 사회정책 편향을 보였고 Claude만 국가별 맥락에 유의미한 민감성을 보였다고 밝혔습니다. 논문은 LLM이 전문가의 심의를 보조할 수는 있으나 대체할 수는 없다고 결론내리고, 어떤 모델을 쓰더라도 독립 검증 체계로 암묵적 배분 편향을 정기적으로 측정하고 모델 출력을 정책 입력값으로 그대로 사용하지 않도록 하는 등 AI 거버넌스가 필요하다고 권고했습니다.



