IT뉴스모아news terminal

article detail

합쳐지고, 가벼워지고, 살아 움직이는 AI [정원훈의 AI 트렌드]

IT조선LLM디지털휴먼멀티모달모델경량화영상생성오픈소스온디바이스음성합성
2026. 5. 29. 오전 6:00
합쳐지고, 가벼워지고, 살아 움직이는 AI [정원훈의 AI 트렌드]

AI 요약

이번 주 허깅페이스 관련 흐름은 '하나로 합쳐지고, 작아지고, 살아 움직이는' 변화로, 핵심 키워드는 바이트댄스의 30억 파라미터 통합 멀티모달 랜스(Lance), 오픈BMB의 1B 온디바이스 추론 LLM 미니CPM5-1B, 메이투안의 디지털 휴먼 롱캣-비디오-아바타-1.5(LongCat-Video-Avatar-1.5)입니다. 랜스는 이미지·영상의 이해·생성·편집을 단일 체크포인트로 처리하는 Any-to-Any 통합 멀티모달 모델로 활성 파라미터 30억, A100 128장으로 from-scratch 학습됐고 아파치 2.0 라이선스로 공개되며 출력은 768×768 이미지와 480p·12fps 영상으로 제한됩니다. 미니CPM5-1B는 약 10억 파라미터로 7개 평가 영역 평균 42.57점을 기록했고 128K 토큰, 모델 컨텍스트 프로토콜(MCP)과 네이티브 도구 호출을 지원해 스마트폰 내 에이전트 시나리오를 가능하게 하며, 롱캣-비디오-아바타-1.5는 사진과 음성만으로 자연스럽게 말하고 움직이는 디지털 휴먼 영상 합성의 오픈소스 상업 활용 수준에 도달했습니다.

원문보기
feed://articles/related관련 기사
[조간브리핑]영상 이해하는 물리 AI '파바스', 구글·인텔도 못한 '진짜 소리' 생성 기술 한국 선점헬로디디
2026. 5. 27. 오전 10:16

[조간브리핑]영상 이해하는 물리 AI '파바스', 구글·인텔도 못한 '진짜 소리' 생성 기술 한국 선점

물리AI영상생성음성합성멀티모달생성형AI저작권오가노이드로봇과학
이미지도, 영상도, 편집도 한 모델로 ‘영상 올인원 AI’ [정원훈의 AI 트렌드]IT조선
2026. 5. 22. 오전 6:00

이미지도, 영상도, 편집도 한 모델로 ‘영상 올인원 AI’ [정원훈의 AI 트렌드]

멀티모달영상생성이미지편집오픈소스미니모델양자화TTSGPU
“하루 1조 토큰 시대”…구글, ‘가성비 AI’ 제미나이 3.5 플래시 공개한겨레
2026. 5. 20. 오후 2:50

“하루 1조 토큰 시대”…구글, ‘가성비 AI’ 제미나이 3.5 플래시 공개

생성형AI경량모델LLM비용절감에이전트멀티모달영상생성음성인식
네이버 R&D 6000억 첫 돌파…카카오는 비용 줄이고 AI 협력 강화전자신문
2026. 5. 17. 오후 2:00

네이버 R&D 6000억 첫 돌파…카카오는 비용 줄이고 AI 협력 강화

AI에이전트R&D투자LLM멀티모달온디바이스AI협력브라우저데브옵스
맥북 특화 'AI 추론 엔진' 풀린다전자신문
2026. 5. 15. 오후 12:37

맥북 특화 'AI 추론 엔진' 풀린다

AI추론오픈소스애플실리콘MLX맥OSLLM멀티모달에이전트
피씨엔, 소멸 위기 '제주어' AI 번역 모델 개발…오픈소스로 전면 공개전자신문
2026. 5. 8. 오후 2:19

피씨엔, 소멸 위기 '제주어' AI 번역 모델 개발…오픈소스로 전면 공개

언어모델제주어번역오픈소스LLM방언보존AI허브온디바이스
딥브레인AI, 온디바이스 ‘대화형 AI 아바타’ 공개…”안전하게 기업 도입 가능”AI타임스
2026. 5. 6. 오후 3:55

딥브레인AI, 온디바이스 ‘대화형 AI 아바타’ 공개…”안전하게 기업 도입 가능”

AI아바타대화형AI온디바이스생성AILLMAI상담정보보안음성합성
문샷AI, 오픈소스 LLM 키미-K2.6 출시…"GPT-5.4·클로드 오퍼스 4.6 능가"네이트
2026. 4. 21. 오후 2:58

문샷AI, 오픈소스 LLM 키미-K2.6 출시…"GPT-5.4·클로드 오퍼스 4.6 능가"

오픈소스LLM거대언어모델멀티모달에이전트벤치마크MoE어텐션메커니즘
아들 사망 소식 숨기고 AI로 살려내…80대 노모와 매일 영상통화전자신문
2026. 4. 14. 오전 10:00

아들 사망 소식 숨기고 AI로 살려내…80대 노모와 매일 영상통화

AI복제디지털휴먼음성합성영상생성윤리논란그리프케어신원사칭감정노동
구글이 문을 열고, 넷플릭스가 사람을 지웠다 [정원훈의 AI 트렌드]IT조선
2026. 4. 10. 오전 6:00

구글이 문을 열고, 넷플릭스가 사람을 지웠다 [정원훈의 AI 트렌드]

오픈소스멀티모달음성합성비디오편집언어모델MoE아키텍처제로샷학습에이전트
“젬마4, 딥시크 충격 못지 않다”…다시 고개드는 ‘자체 AI 개발 무용론’디지털데일리
2026. 4. 7. 오전 6:10

“젬마4, 딥시크 충격 못지 않다”…다시 고개드는 ‘자체 AI 개발 무용론’

오픈소스생성형AI소형모델온디바이스에이전트AI음성처리멀티모달토큰비용
개방·경량 AI 경쟁 본격화…구글 젬마4 확산v.daum.net
2026. 4. 7. 오전 6:15

개방·경량 AI 경쟁 본격화…구글 젬마4 확산

개방형AI경량모델오픈소스생태계에이전트온디바이스LLM