IT뉴스모아news terminal

article detail

[기고]AI가 학습할 수 있는 데이터를 만드는 사람들

노컷뉴스AI모델AI학습데이터구축데이터품질도메인전문성스마트팜온톨로지전처리
2026. 4. 15. 오전 5:00
[기고]AI가 학습할 수 있는 데이터를 만드는 사람들

AI 요약

대한민국은 알고리즘과 반도체·클라우드·파운데이션 모델에 막대한 투자를 하고 있으나 AI 학습용 데이터 준비가 부족해 감사원 조사에서 정부가 약 2조5천억 원을 투자한 AI 데이터 구축 사업 중 360종 가운데 122종(34%)이 품질 불량으로 활용되지 못했고 47%가 품질 목표를 달성하지 못했으며 일부 사업은 최대 26개월간 데이터가 단 한 건도 생성되지 않았습니다. 농촌진흥청은 스마트팜 1200여 개소에서 16억 건의 데이터를 축적하고 AI 스마트농업에 1595억 원을 투자했지만 센서 결측, 포맷 불일치, 비정형 수기 기록 등으로 제1차 스마트농업 육성 기본계획에 '인공지능 표준 추진율 0%'를 명시했고 전처리에 전체 프로젝트 기간의 60~70%가 소요된다고 보고되었습니다. 필자는 간호과정(ADPIE)의 사정·진단·평가·재사정 순환 구조와 인과관계 온톨로지 도입을 통해 사전 목적·범위 정의와 도메인 전문성, 재순환 루프를 보완하면 데이터 품질 문제를 구조적으로 해결할 수 있다고 제안하며 데이터 품질을 5% 개선하면 AI 모델 정확도가 15~20% 향상된다는 실증 결과가 반복 보고되고 있다고 지적합니다.

원문보기
feed://articles/related관련 기사
[기고]AI가 학습할 수 있는 데이터를 만드는 사람들v.daum.net
2026. 4. 15. 오전 5:03

[기고]AI가 학습할 수 있는 데이터를 만드는 사람들

AI데이터데이터품질알고리즘스마트팜전처리데이터수집모델성능온톨로지
“범용 데이터는 끝났다”… 플리토, 국어원 말뭉치 사업 수주더에이아이
2026. 4. 13. 오후 4:11

“범용 데이터는 끝났다”… 플리토, 국어원 말뭉치 사업 수주

말뭉치데이터구축언어모델AI학습다국어데이터기업LLM초개인화
[AI픽] 공공기관 AI 학습용 데이터 100종 추린다…첫 전수조사v.daum.net
2026. 4. 10. 오후 12:01

[AI픽] 공공기관 AI 학습용 데이터 100종 추린다…첫 전수조사

AI학습공공데이터데이터센서스데이터가공비식별화데이터제공AI활용데이터품질
정부, 공공부문 AI 학습용 데이터 첫 전수조사v.daum.net
2026. 4. 10. 오후 12:04

정부, 공공부문 AI 학습용 데이터 첫 전수조사

AI학습공공데이터데이터조사비식별화AI허브데이터품질정부정책데이터제공
정부, AI 학습용데이터 첫 전수조사…'AI허브' 경쟁력 높인다v.daum.net
2026. 4. 10. 오후 12:02

정부, AI 학습용데이터 첫 전수조사…'AI허브' 경쟁력 높인다

생성형AI데이터관리공공데이터AI학습데이터구축비식별화AI허브데이터개방
“앤트로픽 잡는다”⋯오픈AI, 보안 모델 ‘GPT-5.4-사이버’ 출시브릿지경제
2026. 4. 15. 오전 8:15

“앤트로픽 잡는다”⋯오픈AI, 보안 모델 ‘GPT-5.4-사이버’ 출시

AI모델보안사이버악성코드취약점리버스엔지니어링오픈AI앤트로픽
오픈AI, 보안 전용모델 전문가에 한정 공개…앤트로픽에 맞불v.daum.net
2026. 4. 15. 오전 7:03

오픈AI, 보안 전용모델 전문가에 한정 공개…앤트로픽에 맞불

보안AI취약점탐지사이버보안AI모델버그마게돈방어기술이진역공학신뢰성검증
경콘진, 빅테크 연계 AI 스타트업 육성 프로젝트 ‘AI 허브 사업’ 설명회부천포커스
2026. 4. 15. 오전 7:51

경콘진, 빅테크 연계 AI 스타트업 육성 프로젝트 ‘AI 허브 사업’ 설명회

AI스타트업빅테크연계콘텐츠허브GPU클라우드AI모델데이터사업화자금
“미국과 중국 AI 모델 성능 격차 거의 없다”서울경제
2026. 4. 15. 오전 6:00

“미국과 중국 AI 모델 성능 격차 거의 없다”

AI모델성능격차미중경쟁대규모언어모델AI인덱스기술격차AI개발
오픈AI, 일부 전문가에 '보안 전용 모델' 우선 제공v.daum.net
2026. 4. 15. 오전 7:30

오픈AI, 일부 전문가에 '보안 전용 모델' 우선 제공

보안취약점사이버보안AI모델바이너리분석악성코드탐지한정배포신뢰접근프로그램
"AI 모델 3위·특허 1위"…한국, 글로벌 AI 3대 강국 '가시권'노컷뉴스
2026. 4. 14. 오전 9:28

"AI 모델 3위·특허 1위"…한국, 글로벌 AI 3대 강국 '가시권'

AI모델AI특허AI도입로봇AI인재민간투자AI법안강국경쟁
양자 AI 모델 '아이싱' 공개…"업계 표준보다 2.5배 빨라"마켓인
2026. 4. 15. 오전 6:16

양자 AI 모델 '아이싱' 공개…"업계 표준보다 2.5배 빨라"

양자컴퓨팅AI모델성능향상기술혁신