2026.01.08 (목)

  • 맑음동두천 -6.0℃
  • 맑음강릉 -2.0℃
  • 맑음서울 -4.6℃
  • 맑음대전 -3.7℃
  • 맑음대구 -1.0℃
  • 맑음울산 -2.3℃
  • 맑음광주 -1.6℃
  • 맑음부산 0.0℃
  • 맑음고창 -3.4℃
  • 흐림제주 3.8℃
  • 맑음강화 -7.2℃
  • 맑음보은 -6.0℃
  • 맑음금산 -4.2℃
  • 맑음강진군 -0.8℃
  • 맑음경주시 -1.3℃
  • 맑음거제 -2.3℃
기상청 제공


통신


SK텔레콤, 초거대 AI ‘A.X K1’ 기술 보고서 공개

[FETV=신동현 기자] SK텔레콤 정예팀이 매개변수 519B(5190억 개) 규모의 초거대 AI 모델 ‘A.X K1’의 기술 보고서를 오픈소스 플랫폼 허깅페이스에 공개했다고 7일 밝혔다. 

 

A.X K1은 약 4개월의 개발 기간과 제한된 GPU 자원 속에서 완성된 초거대 언어모델이다. SK텔레콤 정예팀은 자체 GPU 1000여 개를 활용해 모델을 학습했으며 정부 지원 없이 내부 자원만으로 개발을 진행했다.

 

 

보고서에 따르면 A.X K1은 519B 규모에도 불구하고 주요 벤치마크에서 글로벌 오픈소스 초거대 모델과 유사하거나 이를 상회하는 성능을 기록했다. 비교 대상에는 매개변수 685B 규모의 DeepSeek-V3.1과 357B 규모의 GLM-4.6 모델이 포함됐다.

 

수학 성능을 측정하는 AIME25 벤치마크에서 A.X K1은 89.8점을 기록해 딥시크-V3.1(88.4점) 대비 약 102% 수준의 성능을 보였다. AIME25는 미국 수학 올림피아드 문제를 기반으로 AI의 고난도 수학 추론 능력을 평가하는 시험이다.

 

코딩 능력을 평가하는 LiveCodeBench에서는 영어 기준 75.8점, 한국어 기준 73.1점을 기록했다. 이는 딥시크-V3.1의 영어 69.5점, 한국어 66.2점 대비 각각 약 109%, 110%에 해당하는 수치다. LiveCodeBench는 사전 학습이 불가능한 최신 문제를 활용해 실시간 코드 작성 능력을 평가한다.

 

A.X K1은 효율성을 고려한 구조 설계도 특징이다. 전체 519B 파라미터 중 33B만을 선택적으로 활성화하는 전문가 혼합(MoE, Mixture of Experts) 구조를 적용해 학습 안정성과 연산 효율을 동시에 확보했다. 또한 최대 128K 토큰 길이의 문맥을 처리할 수 있어 장문 문서 분석에도 활용 가능하다.

 

모델 학습에는 웹 데이터, 코드 데이터, 이공계(STEM) 데이터, 추론 데이터 등 약 10조 개 규모의 고품질 데이터가 투입됐다. 한국어 특화 PDF 문서 파싱과 합성 데이터 생성, 난이도별 커리큘럼 학습 방식도 적용됐다.

 

SK텔레콤은 향후 추가 연구를 통해 A.X K1의 성능을 고도화하고 연내 멀티모달 기능을 추가하는 한편 조 단위 파라미터 규모로 모델을 확장할 계획이다.