IT뉴스모아news terminal

article detail

"그리는 것이 곧 이해하는 것"…구글, 생성 AI로 비전 AI 역할까지 하는 '비전 바나나' 공개

AI타임스객체분할깊이추정비전AI생성AI시각이해의미론적분할이미지생성파운데이션모델

2026. 4. 26. 오후 12:49

"그리는 것이 곧 이해하는 것"…구글, 생성 AI로 비전 AI 역할까지 하는 '비전 바나나' 공개

AI 요약

구글 딥마인드 연구진은 24일(현지시간) 이미지 생성 능력은 유지하면서 의미론적 분할, 객체 분할, 단안 깊이 추정, 표면 법선 추정 등 다양한 시각 이해 작업을 수행하는 통합 모델 '비전 바나나(Vision Banana)'를 arXiv에 공개했습니다. 연구진은 이미지 생성 모델 '나노 바나나 프로'에 소량의 시각 과제 데이터를 더한 경량 지시 튜닝과 'V-토큰'을 적용해 모든 출력을 RGB 이미지로 통일함으로써 제로샷 환경에서 SAM 3와 뎁스 애니싱 등 최신 특화 모델들과 대등하거나 더 나은 성능을 기록하면서도 생성 성능 저하가 없음을 보여주었습니다. 연구진은 이를 근거로 이미지 생성 학습이 시각적 이해를 포함하는 사전학습 역할을 하며 생성 비전 사전학습이 파운데이션 모델 구축의 핵심이 될 수 있다고 강조했습니다.

영상·이미지·음성·음악까지: 생성AI 서비스 시장 지형도 2026

2026. 4. 18. 오전 5:19

영상·이미지·음성·음악까지: 생성AI 서비스 시장 지형도 2026

생성AI영상생성이미지생성음성합성음악생성파운데이션모델콘텐츠제작시장지형

서울공대 도재영 교수팀, 차세대 통합 AI 파운데이션 모델 ‘Dynin-Omni’ 개발

동아비즈니스리뷰 | DBR

2026. 4. 8. 오후 6:35

서울공대 도재영 교수팀, 차세대 통합 AI 파운데이션 모델 ‘Dynin-Omni’ 개발

파운데이션모델멀티모달생성AI디퓨전음성처리이미지생성영상이해정보추론

마이크로소프트, 첫 자체 추론 AI 모델 공개…오픈AI와 시너지 극대화

2026. 6. 3. 오전 11:30

마이크로소프트, 첫 자체 추론 AI 모델 공개…오픈AI와 시너지 극대화

추론모델생성AI클라우드GPUAI워크스테이션오픈소스음성처리이미지생성

엔비디아 GTC·컴퓨텍스 달구는 'K-피지컬 AI'…슈퍼브·디든 '출격'

2026. 6. 2. 오후 4:38

엔비디아 GTC·컴퓨텍스 달구는 'K-피지컬 AI'…슈퍼브·디든 '출격'

피지컬AI로보틱스비전AI스타트업데이터큐레이션오토라벨링파운데이션모델휴머노이드

엔비디아 GTC·컴퓨텍스 달구는 'K-피지컬 AI'…슈퍼브·디든 '출격'

2026. 6. 2. 오후 4:36

엔비디아 GTC·컴퓨텍스 달구는 'K-피지컬 AI'…슈퍼브·디든 '출격'

피지컬AI로보틱스비전AI스타트업휴머노이드PoC산업용AI파운데이션모델

엔비디아, 피지컬 AI 위한 파운데이션 모델 ‘코스모스 3’ 출시

2026. 6. 1. 오후 4:09

엔비디아, 피지컬 AI 위한 파운데이션 모델 ‘코스모스 3’ 출시

피지컬AI파운데이션모델로봇자율주행비전AI트랜스포머월드생성액션예측

[굿!디자인] LVMH도 인정한 패션AI...엔엑스엔랩스

2026. 5. 28. 오후 4:00

[굿!디자인] LVMH도 인정한 패션AI...엔엑스엔랩스

패션AI생성AI멀티모달디퓨전스타일테크이미지생성벤처투자딥테크

챗봇처럼… 구글 검색, AI 기반 대변신

2026. 5. 20. 오후 8:18

챗봇처럼… 구글 검색, AI 기반 대변신

AI검색챗봇멀티모달제미나이경량모델검색엔진생성AI비전AI

[게시판] 카카오, AI 생성물에 구글 ‘신스ID’ 적용 등 단신

2026. 5. 20. 오후 7:03

[게시판] 카카오, AI 생성물에 구글 ‘신스ID’ 적용 등 단신

워터마킹생성AI이미지생성영상생성RAG정보보안데이터분류게임개발

NC AI, 커머스 콘텐츠 자동화 솔루션 ‘배키 커머스’ 출시

2026. 5. 20. 오전 11:56

NC AI, 커머스 콘텐츠 자동화 솔루션 ‘배키 커머스’ 출시

생성AI커머스콘텐츠자동화이미지생성디자인자동화챗봇솔루션

카카오, 구글 워터마킹 기술 도입…편집된 AI 사진·영상도 식별

2026. 5. 20. 오전 10:22

카카오, 구글 워터마킹 기술 도입…편집된 AI 사진·영상도 식별

AI생성물워터마킹콘텐츠검증딥페이크생성AI책임감있는AI이미지생성영상생성

[AI픽] NC AI, 사진 한장으로 쇼핑 콘텐츠 만든다

2026. 5. 20. 오전 9:38

[AI픽] NC AI, 사진 한장으로 쇼핑 콘텐츠 만든다

생성형AI커머스이미지생성텍스트생성자동화AI챗봇멀티모달파운데이션모델