article detail
[기고]AI가 학습할 수 있는 데이터를 만드는 사람들
2026. 4. 15. 오전 5:03
AI 요약
대한민국의 AI 정책은 알고리즘 투자에 치중하는 반면 데이터 준비가 미흡해 국가가 투자한 AI 데이터 구축 사업에서 360종 가운데 122종(34%)이 품질 불량으로 활용되지 못했고, 47%가 품질 목표를 달성하지 못했으며 일부 사업은 최대 26개월간 데이터가 단 한 건도 생성되지 않았습니다. 농촌진흥청은 스마트팜 1200여 개소에서 16억 건의 데이터를 축적하고 AI 스마트농업에 1595억 원을 투자했지만 인공지능 표준 추진율 0%로 센서 결측·수집 포맷 불일치·수기 기록 미정형 등으로 전처리에만 전체 프로젝트 기간의 60~70%가 소요되고 있습니다. 필자는 기존 AI 데이터 방법론이 수집 전 필요성 사정·도메인 전문가 추론 내재화·품질 미달 시 자동 재순환을 결여했다며 간호과정(ADPIE)을 적용해 수집 전 목적 정의·진단·재사정을 순환시키고 인과관계 온톨로지를 구축해야 하며, 데이터 품질 개선(예: 5% 개선 시 모델 정확도 15~20% 향상)이 곧 모델 성능의 상한선을 높이는 길이라고 주장합니다.
![[기고]AI가 학습할 수 있는 데이터를 만드는 사람들](https://file2.nocutnews.co.kr/newsroom/image/2026/04/14/202604141359208205_0.jpg)





!["너무 위험해서 공개 불가"...모든 사이트 뚫은 차세대 인공지능에 패닉 [지금이뉴스]](https://image.ytn.co.kr/general/jpg/2026/0414/202604141429342921_t.jpg)

