article detail
700만명 가상 한국인 탄생... 엔비디아, 소버린 AI 핵심 데이터셋 공개
2026. 4. 27. 오후 1:08

AI 요약
엔비디아는 24일(현지시간) 서울에서 열린 네모트론 디벨로퍼 데이즈에서 국내 인구통계·지리·사회적 특성 분포를 반영해 약 700만 개 페르소나와 26개 항목으로 구성된 오픈소스 합성 데이터셋 '네모트론-페르소나-코리아(Nemotron-Personas-Korea)'를 공개했으며 허깅페이스 공개 직후 데이터셋 부문 인기 1위를 기록했습니다. 이 데이터셋은 KOSIS, 대법원, 국민건강보험공단 등 다양한 공공·민간 데이터를 반영해 50~64세 베이비붐층의 두꺼운 인구층, 고령층의 여성 비중 증가, 세대별 교육 수준 격차, 생애주기별 가구 변화와 디지털 경제 중심의 직업 분포 등 한국 사회의 구조적 특징을 재현했고 완전 합성되어 실제 인물과 연관성이 없습니다. 오픈소스로 상업·비상업적 활용이 가능해 금융·의료 등 규제 영역에서의 AI 학습을 지원하고 네이버 클라우드·SK텔레콤·LG AI 연구소 등이 도입했으나 일부 변수 간 상호작용과 가치관 같은 비정형 사회 지표는 포함되지 못했습니다.






