[FETV=신동현 기자] KT가 자체 개발한 한국어 특화 생성형 AI 모델 ‘믿:음 2.0’을 통해 기술 독립형 한국형 AI 모델을 확산시켜 나갈 계획이다. KT는 이를 위한 전략을 3일 개최한 '온라인 기술 브리핑'을 통해 자세히 설명했다. 4일에는 경량 모델 ‘미니(2.4B)’와 중형 모델 ‘베이스(11B)’를 오픈소스로 공개한다.
온라인 기술 브리핑 발표는 해당 모델 개발을 총괄한 신동훈 KT Gen AI Lab장 상무가 맡았다.
◇한국어 특화·B2B 중심 모델, 실용성에 방점
!['믿:음 2.0' 기술 설명회 브리핑 자료 중 일부 [사진 신동현 기자]](http://www.fetv.co.kr/data/photos/20250727/art_17515147506915_a31a2a.png?iqs=0.9674779945653476)
신 상무는 “KT는 한국의 말과 문화를 잘 이해하는 모델, 그리고 기업 환경에서 실질적으로 활용할 수 있는 모델을 만드는 것을 목표로 했다”고 말했다. 그는 “지난 1년간 믿음 모델을 스크래치부터 자체 기술로 재구축해 왔으며 개발을 멈춘 적은 단 한 번도 없다”고 강조했다.
이번에 공개되는 모델은 단순한 언어 생성 기능을 넘어 문서 기반 질의응답(QA), 보고서 작성, 툴 콜링 등 B2B 환경에 특화된 기능을 갖추고 있다. 한국어에 최적화된 토크나이저를 자체 설계해 적용했으며, 국내 AI 커뮤니티와 협력한 최신 기술을 반영해 학습 성능을 끌어올렸다는 설명이다.
◇ 자체 평가체계와 ‘소버린 AI’ 철학 강조
!['믿:음 2.0'은 총 3개의 라인업이 제공 [사진 신동현 기자]](http://www.fetv.co.kr/data/photos/20250727/art_17515148537917_5d3f3f.png?iqs=0.4530863819284745)
모델 학습을 위한 데이터 역시 신중하게 구축됐다. KT는 각 산업 분야의 대표 기관들과 함께 ‘K-데이터 얼라이언스’를 운영하며 고품질 한국어 데이터를 수집했고, 이 데이터를 정제·가공하기 위한 전용 파이프라인도 별도로 설계했다. 라이선스 문제가 있는 콘텐츠는 모두 제외했으며 200여 개 카테고리로 분류해 도메인별로 균형 잡힌 학습이 가능하도록 설계했다.
신 상무는 “한국어 AI 성능을 검증하기 위한 별도의 평가 체계도 구축했다”며 “고려대학교 민족문화연구원과 협력해 한국문화와 표현력을 반영하는 독자적 벤치마크를 개발했고 글로벌 퍼블릭 벤치마크도 병행해 신뢰도를 확보했다”고 밝혔다.
KT의 AI 개발 철학은 ‘소버린 AI’에 기반을 두고 있다. 신 상무는 이 개념에 대해 데이터 주권 확보, 사용자 선택권 보장, 한국적 가치 반영, 책임 있는 AI 운영 4가지 원칙으로 정의했다. 그는 “이 원칙에 따라 개발·학습·배포 전 과정을 설계했다”며 “기술적으로도 외부의 힘을 빌리지 않고 모든 것을 자체 구축했다는 점이 차별화 요소”라고 말했다.
◇ “모든 작업에 GPT 필요 없다”…라인업 분화·사업화 병행
브리핑 이후 진행된 질의응답에서 KT는 향후 모델 개발 계획과 외부 협업 방향성에 대해서도 구체적으로 밝혔다. KT는 마이크로소프트(MS)와 함께 GPT 기반 한국형 모델도 개발하고 있으며 이 모델은 고성능 작업에 적합한 용도로 활용될 예정이다. 믿음 모델은 문서 기반 QA, 요약, 분류 등 단순·중간 수준의 작업에 특화돼 있다.
신 상무는 “모든 작업에 GPT처럼 강력한 모델이 필요한 것은 아니다”라며 “비용과 상황에 따라 고객이 선택할 수 있도록 다양한 라인업을 제공하겠다”고 말했다.
SK텔레콤이 같은 날 공개한 ‘에이다X 4.0’과의 차별점에 대한 질문도 나왔다. 신 랩장은 “에이다X는 외부 공개 모델을 활용한 튜닝 기반이지만, 믿음은 스크래치부터 KT 기술로 학습한 자체 모델”이라며 “규모 차이도 있어 단순 비교는 어렵지만, 고성능 프로 모델도 내부 프리뷰 단계에 도달해 성능 격차를 좁히고 있다”고 설명했다.
수익화 전략에 대해선 “KT는 AI Transformation 기업으로 탈바꿈하고 있으며 믿음 모델은 공공·금융 등 B2B 고객 대상 SI 사업에 활용될 예정”이라고 밝혔다. B2C 서비스 전개 가능성에 대해서도 “내부적으로 다양한 시나리오를 검토하고 있다”고 덧붙였다.
데이터 저작권 문제에 대해서는 “모든 학습 데이터는 정식 구매 혹은 K-데이터 얼라이언스를 통한 수급 방식으로 확보했고 상업적 이용이 불분명한 데이터는 모두 배제했다”고 밝혔다. 이어 KT는 향후 정부의 ‘국가 독자 AI 파운데이션 모델’ 프로젝트에도 참여할 방침이라고 전했다.
이날 발표한 믿음 2.0 모델은 4일부터 오픈소스 플랫폼 허깅페이스(Hugging Face)에서 공개되며 튜토리얼·기술문서와 함께 자유롭게 사용할 수 있다.