article detail
정부, 'AI 데이터 업사이클링' 착수…생성형 AI용으로 데이터 재가공
2026. 5. 7. 오후 12:01
AI 요약
과학기술정보통신부와 한국지능정보사회진흥원은 지난달 30일 AI 학습용 데이터 업사이클링 사업 공고를 시작해 기존 AI 허브에 축적된 691종 중 생성형 AI로 확장 가능성과 활용도를 고려해 외부 전문가 검토로 최종 30종을 선정해 약 30억원 규모로 재가공한다고 밝혔습니다. 재가공은 판별형 라벨링 데이터를 LLM용으로는 '질문-근거 검토-오류 검증-답변 확정' 등 추론 과정을 포함하도록 재구성하고, 피지컬 AI용으로는 시각(V), 언어(L), 행동·제어(A)를 통합해 연속 장면과 객체 상호작용 정보를 포함하도록 고도화합니다. 업사이클링된 데이터는 AI 허브를 통해 공개되어 기업·연구기관·스타트업 등이 활용할 수 있으며, 과기정통부는 이를 통해 비용을 절감하면서 생성형 AI 환경에 맞는 학습데이터와 데이터 자산의 활용 가치를 높이겠다고 밝혔습니다.






![[테크스냅] 정부 데이터셋, LLM·피지컬AI용으로 재가공](https://news.nateimg.co.kr/orgImg/yt/2026/05/07/PCM20240403000097990_P2.jpg)