article detail
[AI-레디] “AI 도입은 늘었는데 경쟁력은 제자리”…문제는 ‘데이터 준비’
2026. 4. 29. 오후 5:02
AI 요약
미국 비영리 AI 연구기관 에포크AI는 사람이 생성한 공공 고품질 텍스트의 보유량을 약 300조 토큰으로 추정하며 학습 데이터 사용량이 현재 속도로 증가하면 늦어도 2032년에는 소진될 것으로 예측했고, 이에 따라 AI가 즉시 활용할 수 있는 구조화된 ‘AI-레디 데이터’와 데이터 준비도가 핵심으로 부상하고 있다고 보도했습니다. 합성 데이터가 대안으로 주목받아 시장은 2025년 약 4억 4,716만 달러에서 2035년 87억 9,000만 달러로 성장할 것으로 예측되며(연평균성장률 약 34.7%), 현재 기업의 34%가 합성 데이터를 사용 중이고 42%가 연구를 진행하지만 표현 다양성 부족과 반복 오류 누적(플리토가 제시한 사례: 3% 오류가 있는 데이터를 학습한 모델로 합성 데이터를 만들면 정확도가 97%에서 94%로 떨어짐) 등의 한계도 지적되고 있습니다. 기업들은 데이터 접근성·품질 문제로 AI 도입에 어려움을 겪고 있는데 클라우데라 조사에서 응답 기업의 96%가 AI를 핵심 비즈니스에 통합했으나 약 80%가 데이터 접근 제약을 겪고 있고, 국내 IT 리더들은 데이터 품질(32%), 통합(22%), 접근·관리(20%) 문제와 데이터 공유 거부감·데이터 리터러시 부족(�� 49%)을 장애요인으로 꼽았으며 가트너는 응답자의 63%가 AI에 적합한 데이터 관리 체계를 갖추지 못했거나 불확실하다고 답해 AI-레디 데이터 부족으로 AI 프로젝트의 60%가 폐기될 수 있다고 전망했습니다.






