article detail
LG AI연구원, 멀티모달 AI '엑사원 4.5' 공개
2026. 4. 9. 오후 2:52
AI 요약
LG AI연구원은 9일 텍스트와 이미지를 동시에 이해하고 추론하는 멀티모달 AI 모델 엑사원(EXAONE) 4.5를 공개했으며 비전 인코더와 거대언어모델을 통합한 비전·언어 모델(VLM) 구조를 적용했다고 밝혔습니다. 엑사원 4.5는 계약서·기술 도면·재무제표 등 복합 문서 이해와 추론에 강점을 보였고 STEM 5개 지표 평균 77.3으로 오픈AI GPT-5 mini·앤트로픽 클로드 소넷 4.5·알리바바 큐웬3를 앞섰으며 라이브코드벤치 v6에서 81.4점을 기록해 구글 젬마4를 웃돌았고 330억 개 파라미터로 기존 K-엑사원 대비 약 7분의 1 크기지만 텍스트 이해와 추론 성능은 동등하다고 설명했습니다. 연구원은 엑사원 4.5를 허깅페이스에 공개해 연구·교육 목적 활용을 지원하고 한국어·영어 외에 스페인어·독일어·일본어·베트남어를 지원한다고 밝히며 향후 음성·영상·물리 환경까지 이해하는 피지컬 인텔리전스 구현을 목표로 동북아역사재단 등과 협력해 한국어와 역사·문화 맥락을 반영한 데이터 학습을 병행하고 자체 위험 분류체계 K-AUT로 신뢰성과 안전성 확보에도 힘을 싣고 있다고 했습니다.


![[AI 클로즈업] 엑사원에 눈 달았다…LG AI연구원, 피지컬 AI 레이스 참전](https://www.ddaily.co.kr/photos/2026/04/10/2026041015352957716_l.jpg)



