article detail
텍스트·이미지 동시에 이해·추론 LG, 멀티모달 AI ‘엑사원 4.5’ 공개
2026. 4. 9. 오전 10:16
AI 요약
LG AI연구원이 9일 텍스트와 이미지를 동시에 이해하고 추론하는 멀티모달 AI 모델 엑사원(EXAONE) 4.5를 공개했습니다. 엑사원 4.5는 자체 개발한 비전 인코더와 거대언어모델을 통합한 비전-언어 모델로 계약서·기술 도면·재무제표·스캔 문서 등 복합 문서를 정확히 읽고 추론하는 능력에 강점이 있으며, STEM 5개 지표 평균 77.3점으로 지피티(GPT)5-mini(73.5점), 클로드 소넷(Claude Sonnet) 4.5(74.6점), 큐웬(Qwen)3 235B(77.0점)를 앞섰고 라이브코드벤치 v6 81.4점으로 구글 젬마 4(80.0점)를 넘었으며 ChartQA Pro에서 62.2점을 기록하는 등 주요 벤치마크에서 경쟁력을 보였습니다. 330억개 파라미터 규모로 K-엑사원보다 약 7분의 1 크기지만 텍스트 이해·추론에서 동등한 수준을 달성했고 하이브리드 어텐션과 멀티 토큰 예측 기반 고속 추론 기술을 적용했으며 한국어·영어 외에 스페인어·독일어·일본어·베트남어를 공식 지원하고 허깅페이스에 연구·학술·교육 목적으로 공개했습니다.


