article detail
NVIDIA, 비전·오디오·언어를 하나로 통합한 Nemotron 3 Nano Omni 모델 출시 — AI 에이전트 효율 최대 9배 향상
2026. 4. 28. 오후 4:00

AI 요약
오늘날 AI 에이전트들이 비전·음성·언어용 별도 모델을 운용하며 시간과 맥락을 잃는 문제를 해결하기 위해 NVIDIA는 비전·오디오·이미지·텍스트를 하나의 시스템으로 통합한 오픈 멀티모달 모델 Nemotron 3 Nano Omni를 공개했습니다. Nemotron 3 Nano Omni는 Conv3D, EVS, 256K 컨텍스트를 갖춘 30B-A3B 하이브리드 MoE 아키텍처로 동급 오픈 옴니 모델 대비 9배 높은 처리량과 동일한 상호작용성을 제공해 비용을 낮추고 확장성을 향상시키며, 복잡한 문서 인텔리전스와 영상·오디오 이해 분야에서 6개 리더보드 상위권을 차지했습니다. 2026년 4월 28일 Hugging Face, OpenRouter, build.nvidia.com 및 25개 이상의 파트너 플랫폼을 통해 제공되며 Aible, Applied Scientific Intelligence(ASI), Eka Care, Foxconn, H Company, Palantir, Pyler 등이 이미 도입했고 Dell Technologies, DocuSign, Infosys, K-Dense, Lila, Oracle, Zefr는 평가 중입니다.


![[현장] "성심당 빵 메뉴까지 추천"…현대차그룹 '글레오AI 에이전트' 뭐길래](https://img1.newsis.com/2026/04/29/NISI20260429_0002124100_web.jpg)

!["강남 맛집 찾아줘" 네이버, 대화로 검색하는 'AI탭' 시범 공개 [팩플]](https://pds.joongang.co.kr/news/component/htmlphoto_mmdata/202604/28/8860c68d-81f3-45c7-9d59-caada7ac8f3a.jpg)



