article detail
기존 AI 허브 데이터, 최신 AI 환경에 맞게 재가공
2026. 5. 7. 오후 12:02
AI 요약
과학기술정보통신부와 한국지능정보사회진흥원은 7일 기존 AI 허브 데이터를 최신 생성형 AI 환경에 맞게 재가공하는 'AI 학습용데이터 업사이클링' 사업 공고를 시작한다고 밝혔습니다. 정부는 기존 판별형 라벨링 데이터를 추론 과정과 행동 정보를 포함하는 생성형 AI용 데이터로 전환해 LLM 및 피지컬 AI 분야 중심으로 총 30종의 데이터셋을 재가공(30억 원 규모)하며, LLM 분야는 질문-근거 검토-오류 검증-답변 확정 등의 추론 과정을 포함하도록, 피지컬 AI 분야는 시각(V), 언어명령(L), 행동·제어(A)를 통합하도록 데이터를 고도화할 계획입니다. 업사이클링된 데이터는 향후 AI Hub를 통해 공개되어 기업·연구기관·스타트업 등이 활용할 수 있도록 제공되며, 최동원 과기정통부 인공지능인프라정책관은 적은 비용으로 최신 생성형 AI 환경에 맞는 학습용데이터를 확보하고 축적된 데이터 자산의 활용 가치를 끌어올리겠다고 밝혔습니다.


![[테크스냅] 정부 데이터셋, LLM·피지컬AI용으로 재가공](https://news.nateimg.co.kr/orgImg/yt/2026/05/07/PCM20240403000097990_P2.jpg)


