article detail
LG, 시각·언어 동시 이해하는 멀티모달 AI ‘엑사원 4.5’ 공개
2026. 4. 9. 오후 2:57
AI 요약
LG AI연구원이 9일 텍스트와 이미지를 동시에 이해하고 추론하는 멀티모달 AI 모델 엑사원(EXAONE) 4.5를 공개했습니다. 엑사원 4.5는 자체 개발한 비전 인코더와 거대언어모델(LLM)을 통합한 비전-언어 모델(VLM)로 계약서·재무제표 등 산업용 복합 문서를 정확히 읽고 맥락을 파악하며 한국어·영어 등 총 6개 국어를 공식 지원합니다. 성능 평가에서 STEM 지표 평균 77.3점으로 오픈AI 지피티(GPT)-5 mini(73.5점)와 앤트로픽 클로드 소넷 4.5(74.6점)를 상회했고 라이브코드벤치 81.4점으로 구글 젬마 4(80.0점)를 넘겼으며, 330억 개 파라미터로 크기를 7분의 1로 줄이면서도 하이브리드 어텐션과 고속 추론 기술로 추론 성능을 유지해 허깅페이스에 연구·학술 목적 공개하고 동북아역사재단 등과 협업해 K-AUT 위험 분류체계를 적용했습니다.





