article detail
[기고]AI가 학습할 수 있는 데이터를 만드는 사람들
2026. 4. 15. 오전 5:00
![[기고]AI가 학습할 수 있는 데이터를 만드는 사람들](https://file2.nocutnews.co.kr/newsroom/image/2026/04/14/202604141359208205_0.jpg)
AI 요약
대한민국은 알고리즘과 반도체·클라우드·파운데이션 모델에 막대한 투자를 하고 있으나 AI 학습용 데이터 준비가 부족해 감사원 조사에서 정부가 약 2조5천억 원을 투자한 AI 데이터 구축 사업 중 360종 가운데 122종(34%)이 품질 불량으로 활용되지 못했고 47%가 품질 목표를 달성하지 못했으며 일부 사업은 최대 26개월간 데이터가 단 한 건도 생성되지 않았습니다. 농촌진흥청은 스마트팜 1200여 개소에서 16억 건의 데이터를 축적하고 AI 스마트농업에 1595억 원을 투자했지만 센서 결측, 포맷 불일치, 비정형 수기 기록 등으로 제1차 스마트농업 육성 기본계획에 '인공지능 표준 추진율 0%'를 명시했고 전처리에 전체 프로젝트 기간의 60~70%가 소요된다고 보고되었습니다. 필자는 간호과정(ADPIE)의 사정·진단·평가·재사정 순환 구조와 인과관계 온톨로지 도입을 통해 사전 목적·범위 정의와 도메인 전문성, 재순환 루프를 보완하면 데이터 품질 문제를 구조적으로 해결할 수 있다고 제안하며 데이터 품질을 5% 개선하면 AI 모델 정확도가 15~20% 향상된다는 실증 결과가 반복 보고되고 있다고 지적합니다.




