article detail
[AI리더스] "존댓말 어려운 AI"…엔비디아가 제시한 해법은
2026. 6. 2. 오후 1:08
AI 요약
정구형 엔비디아코리아 솔루션 아키텍트 팀장은 영어 중심 글로벌 AI 모델이 한국의 존댓말 체계와 지역별·산업별 맥락을 충분히 반영하지 못해 실제 서비스에서 부정확한 답변이 나올 수 있다며 한국어와 문화·산업 데이터 기반의 소버린 AI와 데이터 생태계 구축의 필요성을 강조했습니다. 엔비디아는 한국의 인구통계와 문화적 맥락을 반영한 합성 데이터셋 '네모트론-페르소나-코리아'를 국가통계포털 등 62개 공식 통계·자료를 기반으로 구축했으며, 700만명 수준의 합성 페르소나와 약 17억 토큰, 연령·성별·지역·가구구성 등 다양한 속성, 8000개가 넘는 산업·직업 조합과 이름 약 21만개를 포함하고 CC BY 4.0으로 배포한다고 밝혔습니다. 엔비디아는 확률적 그래프 모델과 네모 큐레이터(NeMo Curator), 네모 데이터 디자이너(NeMo Data Designer)로 개인정보 노출을 줄인 합성 데이터를 만들었고, 가속 컴퓨팅과 네모트론 오픈 모델·훈련 레시피·네모(NeMo) 라이브러리 등 풀스택 플랫폼과 개방적·하이브리드 배포로 국내 개발자들의 훈련·평가·배포를 지원한다고 소개했���니다.







