article detail
구글의 바나나, 이미지 이해도 잘 한다...통합모델 ‘비전 바나나’ 등장
2026. 4. 26. 오후 2:30
AI 요약
구글 딥마인드는 이미지 생성 모델인 나노 바나나를 조정해 이미지 생성 능력과 이해 능력을 모두 갖춘 통합 모델 비전 바나나를 공개했습니다. 비전 바나나는 사진에서 서로 다른 사물을 색으로 구분하거나 같은 사물을 개별적으로 식별하고 사진 속 물체의 깊이를 추정하는 등 프롬프트에 따라 RGB 값으로 변환된 이미지를 출력하며 주요 2D·3D 이해 벤치마크에서 분야별 전문 모델과 유사하거나 뛰어난 성능을 보였습니다. 다만 비전 바나나는 아직 실험 프로젝트로 상용화 단계가 아니며 생성 모델을 활용하는 방식은 기존 경량 특화 모델보다 훨씬 많은 컴퓨팅 연산량을 요구해 속도 향상과 비용 절감이 필요하다고 연구진은 설명했습니다.

![[AX 베스트 프랙티스] 노타 “비전 AI로 교통·안전 영상 분석 최적화”](https://img.etnews.com/news/article/2026/04/24/news-p.v1.20260424.d065f190cbd04b73a1327fe3b285b1ad_P1.jpg)




