article detail
'텍스트·이미지 동시 추론' LG 엑사원 4.5 공개…구글·오픈AI 눌렀다
2026. 4. 9. 오전 10:00

AI 요약
LG AI연구원이 9일 텍스트와 이미지를 동시에 이해·추론하는 멀티모달 AI 모델 엑사원(EXAONE) 4.5를 공개했으며, 이 모델은 자체 개발한 비전 인코더와 거대언어모델을 통합한 비전-언어 모델로 330억개 파라미터(33B) 규모입니다. 엑사원 4.5는 계약서·기술 도면·재무제표 등 복합 문서 이해에 강점을 보였고, STEM 5개 지표 평균 77.3점으로 오픈AI GPT5-mini(73.5점), 앤트로픽 클로드 소넷 4.5(74.6점), 알리바바 큐웬3 235B(77.0점)를 앞섰으며, 13개 지표 평균과 라이브코드벤치 v6(81.4점), ChartQA Pro(62.2점) 등에서도 동급 모델 대비 우수한 성능을 보였습니다. 엑사원 4.5는 K-엑사원보다 약 7분의 1 크기임에도 텍스트 이해·추론에서 동등한 수준을 달성했고, LG AI연구원은 하이브리드 어텐션 구조와 멀티 토큰 예측 기반 고속 추론 기술을 적용했다고 설명했으며 엑사원랩장은 향후 음성·영상·물리 환경까지 이해 범위를 확장하겠다고 밝혔습니다.





