IT뉴스모아news terminal

article detail

구글의 바나나, 이미지 이해도 잘 한다...통합모델 ‘비전 바나나’ 등장

v.daum.net딥러닝멀티모달벤치마크비전AI생성모델이미지이해컴퓨팅통합모델
2026. 4. 26. 오후 2:30
구글의 바나나, 이미지 이해도 잘 한다...통합모델 ‘비전 바나나’ 등장

AI 요약

구글 딥마인드는 이미지 생성 모델인 나노 바나나를 조정해 이미지 생성 능력과 이해 능력을 모두 갖춘 통합 모델 비전 바나나를 공개했습니다. 비전 바나나는 사진에서 서로 다른 사물을 색으로 구분하거나 같은 사물을 개별적으로 식별하고 사진 속 물체의 깊이를 추정하는 등 프롬프트에 따라 RGB 값으로 변환된 이미지를 출력하며 주요 2D·3D 이해 벤치마크에서 분야별 전문 모델과 유사하거나 뛰어난 성능을 보였습니다. 다만 비전 바나나는 아직 실험 프로젝트로 상용화 단계가 아니며 생성 모델을 활용하는 방식은 기존 경량 특화 모델보다 훨씬 많은 컴퓨팅 연산량을 요구해 속도 향상과 비용 절감이 필요하다고 연구진은 설명했습니다.

원문보기
feed://articles/related관련 기사
"글자부터 영상까지 ‘올인원’ 옴니모달 AI, 세계 최초 구현"..서울대 도재영 교수팀, 통합 AI 파운데이션 모델 개발인공지능신문
2026. 4. 7. 오전 10:14

"글자부터 영상까지 ‘올인원’ 옴니모달 AI, 세계 최초 구현"..서울대 도재영 교수팀, 통합 AI 파운데이션 모델 개발

옴니모달파운데이션멀티모달생성AI디퓨전통합모델피지컬AI벤치마크
피씨엔, 과기부 '감정·감성 AI 모델 학습데이터셋 구축' 과제 수주전자신문
2026. 4. 28. 오전 9:49

피씨엔, 과기부 '감정·감성 AI 모델 학습데이터셋 구축' 과제 수주

AI모델감정인식학습데이터멀티모달어노테이션벤치마크정신건강국제표준화
[AX 베스트 프랙티스] 노타 “비전 AI로 교통·안전 영상 분석 최적화”전자신문
2026. 4. 27. 오후 4:00

[AX 베스트 프랙티스] 노타 “비전 AI로 교통·안전 영상 분석 최적화”

비전AI영상분석교통시스템안전감시생성형AI멀티모달지능형교통스마트인프라
오픈AI, 에이전트 능력서 '미소스' 꺾은 GPT-5.5 출시...세계 1위 탈환AI타임스
2026. 4. 24. 오전 7:12

오픈AI, 에이전트 능력서 '미소스' 꺾은 GPT-5.5 출시...세계 1위 탈환

생성형AILLM에이전트벤치마크API멀티모달추론능력토큰가격
한국딥러닝, 글로벌 문서 AI 벤치마크 '제미나이·GPT' 제치고 종합 1위유니콘팩토리
2026. 4. 22. 오전 10:30

한국딥러닝, 글로벌 문서 AI 벤치마크 '제미나이·GPT' 제치고 종합 1위

문서AI멀티모달OCR벤치마크시각언어모델할루시네이션문서파싱구조화
이미지 생성 AI, ‘실무 도구’로… 오픈AI ‘챗GPT 이미지 2.0’ 공개IT조선
2026. 4. 22. 오전 10:29

이미지 생성 AI, ‘실무 도구’로… 오픈AI ‘챗GPT 이미지 2.0’ 공개

이미지생성AI챗GPT생성모델텍스트렌더링멀티모달API실무도구AI화상
문샷AI, 오픈소스 LLM 키미-K2.6 출시…"GPT-5.4·클로드 오퍼스 4.6 능가"네이트
2026. 4. 21. 오후 2:58

문샷AI, 오픈소스 LLM 키미-K2.6 출시…"GPT-5.4·클로드 오퍼스 4.6 능가"

오픈소스LLM거대언어모델멀티모달에이전트벤치마크MoE어텐션메커니즘
서울성모병원, AI로 간암 환자 ‘최적 치료 경로’ 찾는다v.daum.net
2026. 4. 21. 오전 8:39

서울성모병원, AI로 간암 환자 ‘최적 치료 경로’ 찾는다

AI의료간암예후예측멀티모달딥러닝임상코호트치료전략의사결정지원
서울성모병원 '간암 최적 치료' 멀티모달 AI 모델 개발 착수아시아경제
2026. 4. 21. 오전 9:02

서울성모병원 '간암 최적 치료' 멀티모달 AI 모델 개발 착수

간암AI멀티모달딥러닝머신러닝의료영상예후예측임상의사결정
기업용 '클로드 오퍼스 4.7' 출시...근소한 차로 정상 탈환AI타임스
2026. 4. 17. 오전 8:21

기업용 '클로드 오퍼스 4.7' 출시...근소한 차로 정상 탈환

AI모델코딩성능멀티모달벤치마크에이전트토큰효율클라우드API환각감소
중국 혁신 기업 리포트 (10) 즈푸AI ... 칭화대 브레인이 만든 AI 국가대표중앙일보
2026. 4. 15. 오전 7:00

중국 혁신 기업 리포트 (10) 즈푸AI ... 칭화대 브레인이 만든 AI 국가대표

AGI지식그래프딥러닝멀티모달대규모언어모델기업투자반도체상장
미소정보기술, 산업 특화 AI 에이전트 첫선헬로티
2026. 4. 13. 오전 11:22

미소정보기술, 산업 특화 AI 에이전트 첫선

AI에이전트OCR비전AI제조도메인불량감지멀티모달헬스케어