article detail
네이버 "AI 검색, 이제 ‘눈’으로 찾고 실행한다"
2026. 7. 5. 오전 8:00
AI 요약
네이버가 텍스트 기반 대화에서 이미지와 영상까지 이해해 검색·플레이스·쇼핑·예약 등 서비스와 직접 연결하는 '멀티모달 실행형 에이전트'로 AI 검색을 확장하겠다고 발표했습니다. 윤상두 네이버 퓨처 AI 센터 리더는 스마트렌즈 출시(2017년) 이후 10년에 걸친 시각 검색 기술 축적과 2022년 복합 검색, 지난해 AI 브리핑 연계를 기반으로 에이전트가 이미지·영상의 공간 분위기와 맥락을 파악해 실제 행동까지 연결해야 한다고 설명했습니다. 네이버는 멀티모달 임베딩과 MuCo의 멀티턴 학습 등 핵심 기술을 통해 3500만장 규모의 멀티모달 데이터셋을 구축했고 주요 멀티모달 벤치마크에서 경쟁 모델 대비 세계 최고 수준의 성능을 확보했다고 밝혔습니다.