article detail
과기정통부, AI 학습데이터 업사이클링…LLM·피지컬AI에 활용
2026. 5. 7. 오후 12:00

AI 요약
과학기술정보통신부는 한국지능정보사회진흥원과 기존 AI허브 데이터를 생성형 AI 환경에 맞게 재가공하는 AI 학습용데이터 업사이클링 사업 공고를 30일부터 시작한다고 7일 밝혔습니다. 사업은 LLM과 피지컬 AI 분야를 중심으로 총 30종(30억원 규모)의 데이터를 재가공하며 텍스트는 질문·근거 검토·오류 검증·답변 확정을 포함한 추론 과정을 담고 이미지·영상은 시각(V)·언어명령(L)·행동(A) 통합 구조로 고도화해 업사이클링된 데이터는 AI허브를 통해 공개될 예정입니다. 과기정통부는 2022년까지 구축된 AI허브 데이터 691종을 전수 분석하고 외부 전문가 검토를 거쳐 최종 30종을 선정했다고 밝혔습니다.



![[테크스냅] 정부 데이터셋, LLM·피지컬AI용으로 재가공](https://news.nateimg.co.kr/orgImg/yt/2026/05/07/PCM20240403000097990_P2.jpg)
