article detail
[기고]AI가 학습할 수 있는 데이터를 만드는 사람들②
2026. 5. 16. 오전 5:03
AI 요약
감사원은 2024년 5월 정부가 2025년까지 2조 5천억 원을 투입한 AI 학습용 데이터 구축 사업에서 360종 가운데 122종이 품질 불량으로 활용되지 못해 사업비로 1148억 원에 해당했으며 일부 사업은 26개월 동안 데이터가 전혀 만들어지지 않았다고 밝혔습니다. 필자는 원인을 사업을 멈추거나 되돌릴 강제 장치의 부재로 규정하고 ADPIE 기반의 다섯 단계(정의→진단→정량 목표 수립→실시간 모니터링→최종 품질 평가)와 품질 게이트에서 기준 미달 시 자동으로 1단계로 되돌아가게 하는 브레이크 도입을 제안합니다. 또한 AI가 품질 평가에 직접 참여해 문제를 자동으로 찾아 수정 초안을 제시하고, 한국형 독자 AI 파운데이션 모델을 판단의 두뇌로 삼아 데이터 주권을 확보해야 한다고 주장하며 필자는 곧 시작될 국가 AI 데이터 구축 사업에 이 구조를 적용할 준비를 하고 있다고 밝혔습니다.
![[기고]AI가 학습할 수 있는 데이터를 만드는 사람들②](https://file2.nocutnews.co.kr/newsroom/image/2026/05/15/202605151047040972_0.jpg)


![[단독]네이버, AI 학습용 데이터 직접 만든다… EBS-두산백과와 협력](https://dbr.donga.com/upload_dir/kfocus/2026/04/20260417.133755820.2_1776388556_69e189ccbf6a4.jpg)
![[기고]AI가 학습할 수 있는 데이터를 만드는 사람들](https://file2.nocutnews.co.kr/newsroom/image/2026/04/14/202604141359208205_0.jpg)


