article detail
LLM, 연금은 3분의 1로 줄이고 주택은 4배 부풀려…사회 예산 편향 실증
2026. 5. 16. 오전 1:46

AI 요약
런던정경대(LSE) 연구진이 포함된 국제 연구팀이 arXiv에 발표한 논문은 Claude, GPT-4o, DeepSeek, Grok 등 네 종의 LLM이 유럽의 실제 사회 예산 구조와 상당히 다른 방식으로 예산을 배분하며, 공통적으로 연금은 실제 지출의 약 3분의 1로 과소 배분하고 주택은 약 4배, 고용은 약 2배 과대 배분하는 경향이 있음을 수치로 입증했습니다. 연구진은 스페인과 독일을 대상으로 각 모델·국가 조합에 동일한 프롬프트를 6회씩 적용해 총 48개의 할당 결과를 OECD 참고 예산과 비교한 결과 모든 LLM이 괴리된 암묵적 편향을 공유했고, 모델 간 차이는 배분을 집중하거나 분산하는 경향에서 두드러졌으며 Claude만이 국가별 맥락에 의미 있는 민감성을 보였다고 밝혔습니다. 논문은 LLM이 전문가의 심의를 보조할 수는 있지만 대체할 수는 없다고 결론 내렸고, 한국처럼 고령화가 빠른 국가에서는 연금 비중 축소 편향이 정책 논의의 왜곡된 기준점이 될 수 있어 정기적 독립 검증 체계 등 거버넌스 설계가 필요하다고 권고했습니다.

![[AX 베스트 프랙티스] 삼일PwC “기업 대다수가 AI 도입 초기 단계…'ARIX'가 방향 제시”](https://img.etnews.com/news/article/2026/04/27/news-p.v1.20260427.ff17f0daaeb74cadb681aeb78825a40b_P1.png)