IT뉴스모아news terminal

article detail

구글의 바나나, 이미지 이해도 잘 한다...통합모델 ‘비전 바나나’ 등장

v.daum.net딥러닝멀티모달벤치마크비전AI생성모델이미지이해컴퓨팅통합모델

2026. 4. 26. 오후 2:30

구글의 바나나, 이미지 이해도 잘 한다...통합모델 ‘비전 바나나’ 등장

AI 요약

구글 딥마인드는 이미지 생성 모델인 나노 바나나를 조정해 이미지 생성 능력과 이해 능력을 모두 갖춘 통합 모델 비전 바나나를 공개했습니다. 비전 바나나는 사진에서 서로 다른 사물을 색으로 구분하거나 같은 사물을 개별적으로 식별하고 사진 속 물체의 깊이를 추정하는 등 프롬프트에 따라 RGB 값으로 변환된 이미지를 출력하며 주요 2D·3D 이해 벤치마크에서 분야별 전문 모델과 유사하거나 뛰어난 성능을 보였습니다. 다만 비전 바나나는 아직 실험 프로젝트로 상용화 단계가 아니며 생성 모델을 활용하는 방식은 기존 경량 특화 모델보다 훨씬 많은 컴퓨팅 연산량을 요구해 속도 향상과 비용 절감이 필요하다고 연구진은 설명했습니다.

"글자부터 영상까지 ‘올인원’ 옴니모달 AI, 세계 최초 구현"..서울대 도재영 교수팀, 통합 AI 파운데이션 모델 개발

인공지능신문

2026. 4. 7. 오전 10:14

"글자부터 영상까지 ‘올인원’ 옴니모달 AI, 세계 최초 구현"..서울대 도재영 교수팀, 통합 AI 파운데이션 모델 개발

옴니모달파운데이션멀티모달생성AI디퓨전통합모델피지컬AI벤치마크

[오재근의 감각지능] DX와 디지털리트로핏(하), AI가 배워야 할 찰나의 감각

2026. 6. 5. 오후 2:57

[오재근의 감각지능] DX와 디지털리트로핏(하), AI가 배워야 할 찰나의 감각

제조현장AI학습센서신호딥러닝공구마모불량판별멀티모달디지털리트로핏

오프라인 구동 가능한 기업용 AI…구글 ‘젬마4 12B’ 공개

바이라인네트워크

2026. 6. 4. 오후 5:08

오프라인 구동 가능한 기업용 AI…구글 ‘젬마4 12B’ 공개

오픈소스오프라인AI기업용AILLM멀티모달엣지컴퓨팅매개변수벤치마크

"공룡 발자국 소리까지 AI가 만든다"... KAIST, 물리 법칙 이해하는 차세대 생성AI 개발

2026. 6. 4. 오후 4:54

"공룡 발자국 소리까지 AI가 만든다"... KAIST, 물리 법칙 이해하는 차세대 생성AI 개발

생성AI음향합성물리엔진영상처리딥러닝멀티모달음성생성컴퓨터비전

현실감 있는 소리 생성하는 AI 기술 '파바스' 개발

정보통신신문

2026. 5. 26. 오후 4:26

현실감 있는 소리 생성하는 AI 기술 '파바스' 개발

음향생성영상처리물리인식AI효과음음성합성딥러닝멀티모달

"상황 이해보다 현실감" KAIST, 장면 맞춤형 효과음 생성 AI 개발

2026. 5. 26. 오전 9:16

"상황 이해보다 현실감" KAIST, 장면 맞춤형 효과음 생성 AI 개발

음성합성영상분석물리정보효과음생성AI기술딥러닝멀티모달

KAIST-포스텍-소니AI, 현장감에 가장 가까운 소리 생성 AI기술 개발

2026. 5. 26. 오전 9:00

KAIST-포스텍-소니AI, 현장감에 가장 가까운 소리 생성 AI기술 개발

음성생성물리추론영상이해AI기술사운드멀티모달딥러닝컴퓨터비전

"공룡 발소리까지 재현"…카이스트, 물리법칙 이해하는 효과음 AI 개발

2026. 5. 26. 오전 8:46

"공룡 발소리까지 재현"…카이스트, 물리법칙 이해하는 효과음 AI 개발

효과음생성영상음향물리추론AI음성합성멀티모달딥러닝컴퓨터비전

[Pocus 기획] 아트센터 나비 인공지능 교육, 무엇이 다른가

2026. 5. 23. 오전 2:29

[Pocus 기획] 아트센터 나비 인공지능 교육, 무엇이 다른가

AI교육컴퓨터비전이미지분류생성모델영상생성멀티모달차원복원창조적리터러시

[人사이트] 박재형 KT 프론티어AI랩장 “믿:음 K, 실사용성으로 외산 AI와 차별화”

2026. 5. 21. 오후 4:00

[人사이트] 박재형 KT 프론티어AI랩장 “믿:음 K, 실사용성으로 외산 AI와 차별화”

자체AI모델한국어AI신뢰AI멀티모달에이전트AI음성인식비전AI피지컬AI

챗봇처럼… 구글 검색, AI 기반 대변신

2026. 5. 20. 오후 8:18

챗봇처럼… 구글 검색, AI 기반 대변신

AI검색챗봇멀티모달제미나이경량모델검색엔진생성AI비전AI

구글이 인간처럼 행동할 수 있는 차세대 인공지능 '제미니 3.5'를 출시했습니다.

2026. 5. 20. 오후 12:12

구글이 인간처럼 행동할 수 있는 차세대 인공지능 '제미니 3.5'를 출시했습니다.

AI모델에이전트멀티모달코드생성벤치마크안전성API구독서비스