article detail
공공데이터는 많다. 문제는 AI가 배울 현실이 부족하다는 것이다.
2026. 5. 26. 오전 9:02

AI 요약
박지환 씽크포비엘 대표는 좋은 인공지능(AI)은 고품질 학습데이터에서 나오며, 한국어·제도·문화·산업 현실이 담긴 데이터가 필요하다고 지적했습니다. 민간의 고품질 데이터는 저작권 문제로 확보가 어렵고, 그 대안으로 행정·복지·안전·산업 등 방대한 공공데이터가 주목받지만 공공데이터는 애초 행정 목적에 맞춰 구성되어 있어 그대로 공개한다고 곧바로 AI 학습에 적합하지 않습니다. 따라서 데이터 획득·정제·가공·검수와 품질 관리 가이드, 다양성 검토와 충실도 진단 같은 절차가 필요하며, 이러한 진단서 없이 무작정 다량 공개하면 자원 낭비와 편향을 키워 인공지능 산업에 거품만 만들 우려가 있습니다.




