IT뉴스모아news terminal

article detail

"상황 이해보다 현실감" KAIST, 장면 맞춤형 효과음 생성 AI 개발

v.daum.netAI기술딥러닝멀티모달물리정보영상분석음성합성효과음생성
2026. 5. 26. 오전 9:16
"상황 이해보다 현실감" KAIST, 장면 맞춤형 효과음 생성 AI 개발

AI 요약

KAIST 전산학부 오태현 교수 연구팀이 POSTECH, 소니 AI와 공동으로 물체의 질량과 속도 등 물리적 정보를 스스로 추론해 영상에 맞춘 효과음을 생성하는 AI 기술 '파바스(Physics-Aware Video-to-Audio Synthesis·PAVAS)'를 개발했다고 26일 밝혔다. 파바스는 영상 속 움직임과 충돌 특성을 분석해 물체의 무게와 속도 변화에 따라 소리의 크기와 음색을 자연스럽게 변화시키며 실제 환경과 유사한 소리를 생성하는 것으로 검증됐다. 연구는 POSTECH 오현빈 학생이 제1 저자이고 오태현 교수 및 소니 AI의 타키다 유타·우에사카 토시미츠·미츠후지 유키 연구원이 공동 저자로 참여했으며 논문은 CVPR 2026에서 오랄 발표로 채택돼 논문은 내달 6일 발표될 예정이다.

원문보기
feed://articles/related관련 기사
"공룡 발소리까지 재현"…카이스트, 물리법칙 이해하는 효과음 AI 개발v.daum.net
2026. 5. 26. 오전 8:46

"공룡 발소리까지 재현"…카이스트, 물리법칙 이해하는 효과음 AI 개발

효과음생성영상음향물리추론AI음성합성멀티모달딥러닝컴퓨터비전
현실감 있는 소리 생성하는 AI 기술 '파바스' 개발정보통신신문
2026. 5. 26. 오후 4:26

현실감 있는 소리 생성하는 AI 기술 '파바스' 개발

음향생성영상처리물리인식AI효과음음성합성딥러닝멀티모달
KAIST, 화면 맥락 분석해 맞춤형 효과음 생성해주는 AI ‘파바스’ 개발AI타임스
2026. 5. 26. 오후 4:04

KAIST, 화면 맥락 분석해 맞춤형 효과음 생성해주는 AI ‘파바스’ 개발

효과음생성AI음성합성물리정보추론영상분석AR메타버스로보틱스
KAIST, 영상 속 질량·속도까지 읽는 AI, 맞춤형 효과음 만든다mstoday.co.kr
2026. 5. 26. 오전 10:31

KAIST, 영상 속 질량·속도까지 읽는 AI, 맞춤형 효과음 만든다

영상분석물리량추론효과음생성음향합성AI기술메타버스AR/VR시뮬레이션
KAIST-포스텍-소니AI, 현장감에 가장 가까운 소리 생성 AI기술 개발v.daum.net
2026. 5. 26. 오전 9:00

KAIST-포스텍-소니AI, 현장감에 가장 가까운 소리 생성 AI기술 개발

음성생성물리추론영상이해AI기술사운드멀티모달딥러닝컴퓨터비전
KAIST·포스텍·소니 AI, 영상 속 물체의 질량·속도 추론해 장면 맞춤형 효과음 생성 AI 개발인공지능신문
2026. 5. 26. 오전 8:38

KAIST·포스텍·소니 AI, 영상 속 물체의 질량·속도 추론해 장면 맞춤형 효과음 생성 AI 개발

영상합성음성생성물리정보AI기술멀티모달효과음음향합성컴퓨터비전
CJ그룹, AI 논문 국제 학술대회 ICLR 2026 채택아시아경제
2026. 4. 30. 오후 2:10

CJ그룹, AI 논문 국제 학술대회 ICLR 2026 채택

AI기술영상분석장면인식학술발표콘텐츠제작자동편집컴퓨터비전딥러닝
수천만년 전 공룡 발자국 소리도 ‘정확히’ 알아낸다…AI 음향 생성 기술 개발경향신문
2026. 5. 26. 오후 3:28

수천만년 전 공룡 발자국 소리도 ‘정확히’ 알아낸다…AI 음향 생성 기술 개발

AI음향생성음성합성물리시뮬레이션멀티모달AI영상분석게임엔진메타버스
영상 속 물체 질량·속도 추론해 맞춤형 효과음 생성 AI 개발v.daum.net
2026. 5. 26. 오후 3:00

영상 속 물체 질량·속도 추론해 맞춤형 효과음 생성 AI 개발

생성AI음향합성물리정보추론영상분석효과음생성AR/VR메타버스로보틱스
"공룡 발소리까지 재현"…카이스트, 물리법칙 이해하는 효과음 AI 개발네이트
2026. 5. 26. 오전 8:47

"공룡 발소리까지 재현"…카이스트, 물리법칙 이해하는 효과음 AI 개발

효과음생성음향AI영상음향물리추론생성AI멀티모달
“쿵쿵∼공룡이 실제 걸어오는 듯”, AI로 장면에 딱 맞는 음향 생성v.daum.net
2026. 5. 26. 오전 11:22

“쿵쿵∼공룡이 실제 걸어오는 듯”, AI로 장면에 딱 맞는 음향 생성

AI음향생성물리기반음향영상분석효과음합성AR/VR메타버스시뮬레이션음성합성
딥브레인AI, 감정표현 TTS 고도화디지털데일리
2026. 5. 26. 오전 10:25

딥브레인AI, 감정표현 TTS 고도화

TTS감정표현음성합성AI아바타AI더빙음성기술커스텀보이스멀티모달