article detail
LG, 멀티모달 AI '엑사원 4.5' 공개…문서·이미지 함께 읽고 추론
2026. 4. 9. 오전 10:16
AI 요약
LG AI연구원은 9일 텍스트와 이미지를 함께 이해하는 멀티모달 비전-언어 모델 엑사원(EXAONE) 4.5를 공개했으며 문서·도면·차트 등 복합 정보 해석에 초점을 맞췄다고 밝혔습니다. 이 모델은 자체 비전 인코더와 대형언어모델을 결합한 단일 구조로 파라미터 330억 개 규모지만 13개 시각·추론 벤치마크와 STEM·코딩·차트 해석 평가에서 GPT-5 미니, Qwen3-VL, Gemma 4 등을 상회하는 성능과 개선된 효율을 보였습니다. LG는 엑사원 4.5를 허깅페이스를 통해 오픈 웨이트로 공개해 연구·교육 목적 사용을 허용하고 향후 음성·영상 처리 등으로 확장해 피지컬 AI로 발전시키겠다고 밝혔습니다.

![[AI 클로즈업] 엑사원에 눈 달았다…LG AI연구원, 피지컬 AI 레이스 참전](https://www.ddaily.co.kr/photos/2026/04/10/2026041015352957716_l.jpg)

