LG 엑사원 4.5, 글로벌 B2B 시장 정조준... 크기는 줄이고 지능은 키웠다

입력 2026.04.09. 10:16

LG AI연구원이 텍스트와 이미지를 함께 이해하고 추론하는 멀티모달 인공지능(AI) 모델 '엑사원(EXAONE) 4.5'를 공개했다. 엑사원 시리즈는 텍스트 중심 추론에서 시각 정보 처리로 영역을 넓혔다. LG의 자체 AI 기술이 한 단계 더 넓어졌다는 점에서 주목된다.

9일 LG AI연구원이 공개한 엑사원 4.5는 LG AI연구원이 자체 개발한 비전 인코더와 거대언어모델(LLM)을 하나의 구조로 통합한 비전-언어 모델(VLM)이다. LG AI연구원은 2021년 12월 국내 최초 멀티모달 AI 모델인 엑사원 1.0을 선보인 뒤 관련 기술을 축적해 왔으며, 이번 모델은 독자 AI 파운데이션 모델 프로젝트 'K-엑사원'의 모달리티 확장을 위한 준비 단계라고 밝혔다.

LG AI연구원은 올해 8월 프로젝트 2차수 종료 이후 3차수 진출이 확정되면 본격적인 모달리티 확장에 나설 계획이다. 궁극적으로는 엑사원을 가상 환경을 넘어 물리적 세계를 이해하고 판단하는 피지컬 인텔리전스로 발전시키겠다는 구상도 내놨다.

사진 제공 = LG 사진제공=LG

이번 모델은 계약서, 기술 도면, 재무제표, 스캔 문서 등 산업 현장에서 실제로 다루는 복합 문서를 읽고 이해하는 데 강점을 두고 있다. 이미지 속 글자 인식이나 비정형 데이터 처리에 그치지 않고, 문서 맥락 이해와 질의응답 기능에 무게를 뒀다고 연구원은 설명했다.

LG AI연구원은 엑사원 4.5의 경쟁력을 보여주는 벤치마크 결과도 함께 공개했다. 연구원에 따르면 엑사원 4.5는 STEM(과학·기술·공학·수학) 성능을 측정하는 5개 지표 평균 77.3점을 기록했다. 이는 오픈AI GPT-5 mini의 73.5점, 앤트로픽 Claude Sonnet 4.5의 74.6점, 알리바바 Qwen3 235B의 77.0점을 웃도는 수치라고 연구원은 설명했다.

일반 시각 이해를 측정하는 3개 지표와 이미지·텍스트가 결합된 인포그래픽, 전문 문헌 속 복합 정보를 읽어내는 문서 이해 및 추론 성능 평가 지표 5개를 포함한 총 13개 지표 평균 점수에서도 GPT-5 mini, Claude Sonnet 4.5, Qwen3-VL보다 높은 성능을 보였다고 LG AI연구원은 밝혔다.

[이미지] 엑사원 4.5 글로벌 동급 모델들과의 STEM 벤치마크 성능 비교.jpg 엑사원 4.5 글로벌 동급 모델들과의 STEM 벤치마크 성능 비교 / 사진제공=LG

[이미지] 엑사원 4.5 글로벌 동급 모델들과의 벤치마크 성능 비교.jpg 엑사원 4.5 글로벌 동급 모델들과의 벤치마크 성능 비교 / 사진제공=LG

코딩 성능에서도 경쟁력을 내세웠다. 코딩 성능 대표 지표인 라이브코드벤치(LiveCodeBench) v6에서는 81.4점을 기록해 구글 Gemma 4의 80.0점을 앞섰다. 복잡한 차트를 분석하고 추론하는 능력을 평가하는 ChartQA Pro에서는 62.2점을 기록했다.

LG AI연구원은 성능과 함께 효율성도 강조했다. 엑사원 4.5는 330억개 파라미터 규모로, 지난해 말 공개한 K-엑사원보다 훨씬 작은 크기지만 텍스트 이해와 추론 영역에서 동등한 수준의 성능을 달성했다고 설명했다. 여기에는 자체 개발한 하이브리드 어텐션 구조와 멀티 토큰 예측 기반의 고속 추론 기술이 적용됐다.

지원 언어도 넓혔다. 기존 한국어와 영어에 더해 스페인어, 독일어, 일본어, 베트남어까지 공식 지원 언어를 확장했다.

LG AI연구원은 이날 엑사원 4.5를 글로벌 오픈소스 플랫폼 허깅페이스(Hugging Face)에 연구·학술·교육 목적으로 공개했다. 2024년 8월 '엑사원 3.0'을 국내 최초 오픈 웨이트 모델로 선보인 데 이어, LG AI연구원은 AI 연구 생태계 확장을 이어가겠다고 밝혔다.

[이미지] 엑사원 4.5 언어 처리 및 추론 성능 비교.jpg 엑사원 4.5 언어 처리 및 추론 성능 비교 / 사진제공=LG

[이미지] 엑사원 4.5와 엑사원 4.0 비교.jpg 엑사원 4.5와 엑사원 4.0 비교 / 사진제공=LG

엑사원은 교육 자원으로도 활용되고 있다. LG는 이달 초 엑사원 경량화 모델 개발을 주제로 청년 AI 전문가 육성 프로그램 'LG 에이머스(Aimers)' 해커톤을 열고, 엑사원을 청년들의 AI 역량 강화를 위한 학습 자원으로 활용했다.

이진식 LG AI연구원 엑사원랩장은 "엑사원 4.5는 LG AI가 텍스트를 넘어 시각 정보까지 이해하는 멀티모달 시대로 진입했음을 보여주는 모델"이라며 "이번 모델을 시작으로 음성과 영상, 물리 환경까지 AI의 이해 범위를 확장해 산업 현장에서 실질적으로 판단하고 행동하는 AI를 만들어가겠다"고 말했다.

LG AI연구원은 한국어 능력을 넘어 한국의 역사와 문화, 사회적 맥락까지 깊이 이해하는 AI로 엑사원을 고도화하는 작업도 이어가고 있다. 올해 1월에는 동북아역사재단으로부터 데이터를 제공받아 학습을 진행했으며, 고품질 데이터를 보유한 국내 다른 기관들과의 협업도 논의 중이다.

김명신 LG AI연구원 신뢰안전사무국 총괄은 "한국어 능력을 갖춘 AI는 늘고 있지만, 역사와 문화적 민감성을 깊이 이해하는 것은 차원이 다른 문제"라며 "엑사원은 자체 설계한 AI 위험 분류체계(K-AUT)를 기반으로 풍부한 표현력과 신뢰성을 동시에 확보한 AI로 진화해 나갈 것"이라고 말했다.

기사의 이해를 돕기 위한 자료사진 / 인사이트