article detail
LG, '텍스트·이미지 동시 추론' 멀티모달 AI '엑사원 4.5' 공개
2026. 4. 9. 오전 10:00

AI 요약
LG AI연구원이 9일 공개한 멀티모달 AI 모델 엑사원 4.5는 자체 개발한 비전 인코더와 거대언어모델을 통합한 비전-언어 모델로 계약서, 기술 도면, 재무제표 등 복합 문서를 읽고 추론하는 능력을 갖췄습니다. STEM 5개 지표 평균 77.3점으로 오픈AI GPT5-mini(73.5), 앤트로픽 클로드 소넷 4.5(74.6), 알리바바 큐웬3 235B(77.0)를 앞섰고 13개 지표 평균과 라이브코드벤치 v6 81.4점으로 구글 젬마 4(80.0)보다 높은 성능을 보였습니다. 파라미터 수는 330억(33B)으로 K-엑사원 대비 약 7분의 1 크기지만 텍스트 이해·추론에서 동등한 성능을 달성했고 하이브리드 어텐션 및 멀티 토큰 예측 기반 고속 추론 기술을 적용했으며 한국어·영어 외에 스페인어·독일어·일본어·베트남어를 공식 지원하며 K-엑사원 모달리티 확장 준비 단계로 활용할 예정입니다

