article detail
엔비디아, ‘네모트론-페르소나-코리아’ 오픈소스 공개… 한국형 AI 데이터 활용 기반 확대
2026. 4. 28. 오전 10:11
AI 요약
엔비디아는 자사 한국형 합성 데이터셋 네모트론-페르소나-코리아(Nemotron-Personas-Korea)가 글로벌 인공지능 개발 플랫폼 허깅페이스(Hugging Face)에서 데이터셋 부문 1위를 기록했다고 28일 밝혔습니다. 이 데이터셋은 대한민국의 인구통계학적·지리적·문화적 특성을 정밀하게 반영한 600만 건 규모의 완전한 합성 데이터로, KOSIS(국가통계포털), 대법원, 국민건강보험공단, 한국농촌경제연구원, 네이버 클라우드 등 공공·민간 데이터를 기반으로 이름·성별·연령·혼인 상태·교육 수준·직업·거주 지역과 존댓말 체계·지역별 직업 패턴 등을 반영해 고령층·농촌 지역·다양한 교육·직업군까지 포괄한다고 밝혔습니다. 엔비디아는 해당 데이터셋이 개인정보보호법(PIPA)을 준수하도록 설계돼 오픈소스 라이선스로 공개돼 국내외 개발자가 활용할 수 있으며 데이터 다양성 확대·모델 편향성 완화·응답 품질 향상에 기여할 것으로 기대한다고 전하고, 네모트론 디벨로퍼 데이즈 서울 2026 등을 통해 한국 AI 생태계와의 접점을 확대하고 있다고 밝혔습니다.






