article detail
과기정통부, AI 학습데이터 업사이클링…LLM·피지컬AI에 활용
2026. 5. 7. 오후 12:03
AI 요약
과학기술정보통신부는 한국지능정보사회진흥원과 함께 기존 AI허브 데이터를 생성형 AI 기술 환경에 맞게 재가공하는 AI 학습용데이터 업사이클링 사업 공고를 30일부터 시작한다고 7일 밝혔습니다. 이번 사업은 기존 판별형 라벨링 데이터를 추론 과정과 행동 정보를 포함하는 생성형 AI용으로 전환해 LLM과 피지컬 AI 분야 중심으로 총 30종의 데이터셋을 재가공(30억원 규모)하며, 2022년까지 구축된 AI허브 데이터 691종을 전수 분석해 최종 30종을 선정했습니다. 재가공된 데이터는 LLM 분야에서 질문·근거 검토·오류 검증·답변 확정 등 추론 과정을 포함하도록 하고, 피지컬 AI 분야에서는 시각(V)·언어(L)·행동·제어(A)를 통합한 구조로 고도화해 향후 AI허브를 통해 공개될 예정입니다.

![[테크스냅] 정부 데이터셋, LLM·피지컬AI용으로 재가공](https://news.nateimg.co.kr/orgImg/yt/2026/05/07/PCM20240403000097990_P2.jpg)


