IT뉴스모아news terminal

article detail

"그리는 것이 곧 이해하는 것"…구글, 생성 AI로 비전 AI 역할까지 하는 '비전 바나나' 공개

AI타임스객체분할깊이추정비전AI생성AI시각이해의미론적분할이미지생성파운데이션모델
2026. 4. 26. 오후 12:49
"그리는 것이 곧 이해하는 것"…구글, 생성 AI로 비전 AI 역할까지 하는 '비전 바나나' 공개

AI 요약

구글 딥마인드 연구진은 24일(현지시간) 이미지 생성 능력은 유지하면서 의미론적 분할, 객체 분할, 단안 깊이 추정, 표면 법선 추정 등 다양한 시각 이해 작업을 수행하는 통합 모델 '비전 바나나(Vision Banana)'를 arXiv에 공개했습니다. 연구진은 이미지 생성 모델 '나노 바나나 프로'에 소량의 시각 과제 데이터를 더한 경량 지시 튜닝과 'V-토큰'을 적용해 모든 출력을 RGB 이미지로 통일함으로써 제로샷 환경에서 SAM 3와 뎁스 애니싱 등 최신 특화 모델들과 대등하거나 더 나은 성능을 기록하면서도 생성 성능 저하가 없음을 보여주었습니다. 연구진은 이를 근거로 이미지 생성 학습이 시각적 이해를 포함하는 사전학습 역할을 하며 생성 비전 사전학습이 파운데이션 모델 구축의 핵심이 될 수 있다고 강조했습니다.

원문보기
feed://articles/related관련 기사
영상·이미지·음성·음악까지: 생성AI 서비스 시장 지형도 2026와우테일
2026. 4. 18. 오전 5:19

영상·이미지·음성·음악까지: 생성AI 서비스 시장 지형도 2026

생성AI영상생성이미지생성음성합성음악생성파운데이션모델콘텐츠제작시장지형
서울공대 도재영 교수팀, 차세대 통합 AI 파운데이션 모델 ‘Dynin-Omni’ 개발동아비즈니스리뷰 | DBR
2026. 4. 8. 오후 6:35

서울공대 도재영 교수팀, 차세대 통합 AI 파운데이션 모델 ‘Dynin-Omni’ 개발

파운데이션모델멀티모달생성AI디퓨전음성처리이미지생성영상이해정보추론
‘나노 바나나’ 위협하는 ‘덕테이프’ 출현경향신문
2026. 4. 22. 오후 9:08

‘나노 바나나’ 위협하는 ‘덕테이프’ 출현

이미지생성생성AI챗GPT오픈AI다국어텍스트렌더링성능평가
오픈AI, ‘생각하는 이미지 AI’ 챗GPT 이미지 2.0 공개… “이미지는 장식이 아닌 언어”와우테일
2026. 4. 23. 오전 3:57

오픈AI, ‘생각하는 이미지 AI’ 챗GPT 이미지 2.0 공개… “이미지는 장식이 아닌 언어”

이미지생성생성AI멀티모달챗GPTDALLE텍스트렌더링프롬프트해상도
구글 ‘나노 바나나’에 덕트테이프 붙인 오픈AI더에이아이
2026. 4. 22. 오후 3:43

구글 ‘나노 바나나’에 덕트테이프 붙인 오픈AI

이미지생성생성AI챗GPT추론엔진다국어지원텍스트렌더링캐릭터일관성AI워터마킹
오픈AI, '챗GPT 이미지 2.0' 공개…"한국어 안 깨진다"아시아경제
2026. 4. 22. 오후 2:57

오픈AI, '챗GPT 이미지 2.0' 공개…"한국어 안 깨진다"

이미지생성생성AI텍스트렌더링다국어지원챗GPTUI요소레이아웃
오픈AI, 실무용 이미지 생성 '챗GPT 이미지 2.0' 공개전자신문
2026. 4. 22. 오후 2:31

오픈AI, 실무용 이미지 생성 '챗GPT 이미지 2.0' 공개

이미지생성생성AI멀티모달텍스트렌더링챗GPTAPI실무활용
"이미지 AI 판 바꿨다"…오픈AI, 이미지 생성의 새로운 시대 '챗GPT 이미지 2.0' 공개인공지능신문
2026. 4. 22. 오후 1:06

"이미지 AI 판 바꿨다"…오픈AI, 이미지 생성의 새로운 시대 '챗GPT 이미지 2.0' 공개

이미지생성생성AI챗GPT오픈AI텍스트렌더링멀티모달API베타서비스
오픈AI ‘이미지 2.0’ 공개…한글 텍스트 드디어 안 깨진다동아일보
2026. 4. 22. 오전 11:22

오픈AI ‘이미지 2.0’ 공개…한글 텍스트 드디어 안 깨진다

이미지생성생성AI한글렌더링텍스트인식해상도개선멀티모달프롬프트추론기능
복잡한 텍스트까지 깨짐없이 구현…베일 벗은 이미지 AI ‘덕트 테이프’한겨레
2026. 4. 22. 오전 11:45

복잡한 텍스트까지 깨짐없이 구현…베일 벗은 이미지 AI ‘덕트 테이프’

이미지생성텍스트렌더링생성AI멀티모달웹검색이미지합성다국어지원
“생각하고 그린다”… 오픈AI, ‘추론’ 더한 챗GPT 이미지 2.0 공개더에이아이
2026. 4. 22. 오전 9:54

“생각하고 그린다”… 오픈AI, ‘추론’ 더한 챗GPT 이미지 2.0 공개

이미지생성추론엔진생성AI텍스트렌더링멀티모달AI경쟁디자인자동화
“이미지는 언어”... 오픈AI, 추론하는 모델 ‘챗GPT 이미지 2.0’ 출시AI타임스
2026. 4. 22. 오전 7:57

“이미지는 언어”... 오픈AI, 추론하는 모델 ‘챗GPT 이미지 2.0’ 출시

이미지생성추론모델생성AI챗GPTAPI멀티모달AI워터마크콘텐츠필터