article detail
한국형 AI 데이터 활용의 핵심, Nemotron-페르소나-코리아
2026. 4. 28. 오후 9:49

AI 요약
한국형 합성 데이터셋 ‘Nemotron-페르소나-코리아(Personas-Korea)’가 글로벌 AI 개발 플랫폼 허깅페이스(Hugging Face)에서 데이터셋 부문 1위를 기록했습니다. 600만 건 규모로 국가통계포털(KOSIS), 대법원, 국민건강보험공단, 한국농촌경제연구원, 네이버 클라우드 등 공공·민간 데이터를 기반으로 인구통계·지리·문화적 특성과 존댓말 체계 등을 반영해 완전한 합성 데이터로 구축됐고 국내 개인정보보호법(PIPA)을 준수하도록 설계됐습니다. 해당 데이터셋은 오픈소스 라이선스로 공개돼 국내외 개발자가 활용할 수 있으며 데이터 다양성 확대와 모델 편향성 완화, 응답 품질 향상에 기여할 것으로 기대됩니다.




