[FETV=신동현 기자] LG AI연구원이 독자 기술을 집약한 AI 파운데이션 모델 K-엑사원을 공개했다고 밝혔다. K-엑사원은 정부 주도의 독자 AI 파운데이션 모델 프로젝트 1차 평가에서 13개 벤치마크 중 10개 항목에서 1위를 기록했고 평균 점수 72점으로 참여한 5개 정예팀 가운데 가장 높은 성능을 보였다.
글로벌 AI 성능 평가 기관 ‘아티피셜 어낼리시스(Artificial Analysis)’의 인텔리전스 지수에서도 경쟁력을 확인했다. K-엑사원은 32점을 기록해 오픈 웨이트 모델 기준 세계 7위, 국내 1위에 올랐다. 중국과 미국 모델이 상위권을 차지한 가운데 국내 모델로는 유일하게 글로벌 톱10에 포함됐다. 허깅 페이스에 공개된 이후에는 글로벌 모델 트렌드 순위 2위에 오르며 연구자들의 관심을 받았다.
또 K-엑사원은 미국 비영리 AI 연구기관 ‘에포크(Epoch) AI’가 선정한 ‘주목할 만한 AI 모델’에도 이름을 올렸다. LG AI연구원은 2024년 엑사원 3.5를 시작으로 엑사원 딥, 엑사원 패스 2.0, 엑사원 4.0에 이어 K-엑사원까지 총 5개 모델을 해당 리스트에 올렸다.
K-엑사원은 LG AI연구원이 지난 5년간 축적한 연구 성과를 바탕으로 설계됐다. 데이터 규모 확대에 의존하지 않고, 성능을 높이면서도 학습과 운용 비용을 낮추는 구조적 혁신을 택했다. 핵심 기술로는 슬라이딩 윈도우 어텐션과 글로벌 어텐션을 결합한 ‘하이브리드 어텐션’을 고도화해 적용했으며, 이를 통해 메모리 요구량과 연산량을 엑사원 4.0 대비 70% 줄였다.
토크나이저도 개선해 학습 어휘를 15만 개로 확장했고, 멀티 토큰 예측 구조를 적용해 추론 속도를 기존 대비 150% 높였다. K-엑사원은 총 2360억 개 파라미터를 가진 전문가 혼합(MoE) 모델로, 실제 활성 파라미터는 약 230억 개다. 한 번에 처리할 수 있는 문맥 길이는 26만 토큰으로, 국내 AI 모델 중 가장 길다.
학습 방식에서도 차별화를 꾀했다. 사전 학습 단계에서는 사고 과정을 학습하는 ‘사고 궤적’ 데이터를 활용했고, 사후 학습 단계에서는 오답에서도 학습 효과를 찾는 강화학습 알고리즘과 선호학습 기법을 적용해 문제 해결 능력을 높였다.
안전성과 신뢰성도 핵심 요소로 설정했다. LG AI연구원은 저작권 이슈가 있는 데이터를 사전에 배제하고, 데이터 컴플라이언스 평가를 전면 적용했다. 자체 AI 윤리위원회를 통해 위험 분류 체계를 마련했고, 한국 문화적 맥락을 반영한 ‘KGC-SAFETY’ 지표로 안전성을 평가했다. K-엑사원은 해당 평가에서 평균 97.83점을 기록했다.
LG AI연구원은 1월 28일까지 K-엑사원 API를 무료로 제공한다. 고성능 GPU 없이도 활용할 수 있도록 설계해, 인프라 여건이 제한적인 기업과 연구자도 프런티어급 모델을 실험할 수 있도록 했다. 이와 함께 기술 보고서를 공개하고, 국내 대학원생 대상 인턴십 확대와 국내외 대학과의 공동 연구도 이어갈 계획이다.
최정규 LG AI연구원 에이전틱 AI 그룹장은 “자원의 제약 속에서도 독자 기술 설계로 글로벌 모델과 경쟁할 수 있음을 보여줬다”며 “앞으로도 연구개발을 통해 국내 AI 생태계 확장에 기여하겠다”고 말했다.



