article detail
과기정통부, AI 학습데이터 업사이클링…LLM·피지컬AI에 활용
2026. 5. 7. 오후 12:03

AI 요약
과학기술정보통신부는 한국지능정보사회진흥원과 기존 AI허브 데이터를 생성형 AI 기술 환경에 맞게 재가공하는 ‘AI 학습용데이터 업사이클링’ 사업 공고를 30일부터 시작한다고 7일 밝혔습니다. 2022년까지 구축된 AI허브 데이터 691종을 분석·검토해 총 30종(30억원 규모)을 선정했으며, LLM 분야는 질문·근거 검토·오류 검증·답변 확정 등 추론 과정을 포함하도록, 피지컬 AI 분야는 시각·언어명령·행동·제어(VLA) 구조로 이미지·영상 데이터를 고도화한다고 밝혔습니다. 재가공된 데이터는 AI허브를 통해 공개돼 기업, 연구기관, 스타트업 등이 활용할 수 있도록 제공될 예정입니다.



![[테크스냅] 정부 데이터셋, LLM·피지컬AI용으로 재가공](https://news.nateimg.co.kr/orgImg/yt/2026/05/07/PCM20240403000097990_P2.jpg)
