article detail
AI 예산 배분의 함정과 미래
2026. 5. 16. 오전 1:38
AI 요약
2026년 5월 arXiv에 공개된 런던정경대(LSE) 연구 'Social Policy of Large Language Models...'는 Claude, GPT-4o, DeepSeek, Grok 등 4개 LLM에 대해 스페인·독일 각 조합을 동일한 프롬프트로 6회씩 질의해 총 48개의 예산 할당 결과를 OECD 참고 예산과 비교했다고 보고했습니다. 모든 LLM이 연금을 실제 유럽 지출 수준의 약 3분의 1로 과소 배분하고 주택은 약 4배, 고용은 약 2배로 과대 배분했으며 모델 간에는 예산을 특정 항목에 집중하거나 분산하는 경향 차이가 있고 Claude만 국가별 맥락에 통계적으로 유의미한 민감성을 보였습니다. 연구진은 LLM이 정책 심의를 보조할 수는 있어도 대체할 수는 없다며 AI 편향을 감시·조정하고 투명성·검증 절차를 마련할 필요가 있고, 한국의 행정안전부·기획재정부 등 AI 도입 추진 상황에서 이러한 검증 체계가 시급하다고 결론지었습니다.

![[게시판] 기보, AI 윤리준수 기관으로 지정](https://stock.mk.co.kr/photos/20260507/AKR20260507075500051_01_i_P4.jpg)