article detail
정부, 'AI 데이터 업사이클링' 착수…생성형 AI용으로 데이터 재가공
2026. 5. 7. 오후 12:00

AI 요약
과학기술정보통신부와 한국지능정보사회진흥원은 AI 허브에 축적된 691종 데이터 중 30종을 재가공하는 AI 학습용 데이터 업사이클링 사업을 공고하고 약 30억원을 투입한다고 밝혔습니다. 사업은 판별형 라벨링 데이터를 LLM용으로는 질문-근거 검토-오류 검증-답변 확정 등의 추론 과정을 포함하도록 재구성하고, 피지컬 AI용으로는 시각 정보(V)-언어 명령(L)-행동 및 제어(A)를 통합해 시간 흐름과 객체 간 상호작용을 반영한 데이터로 고도화합니다. 업사이클링된 데이터는 AI 허브를 통해 공개돼 기업·연구기관·스타트업 등이 활용할 수 있도록 제공될 예정이며, 과기정통부는 이를 통해 데이터 품질과 적합성을 높이고 데이터 인프라를 확충해 나갈 계획입니다.



![[테크스냅] 정부 데이터셋, LLM·피지컬AI용으로 재가공](https://news.nateimg.co.kr/orgImg/yt/2026/05/07/PCM20240403000097990_P2.jpg)
