2025.07.16 (수)

  • 흐림동두천 23.0℃
  • 흐림강릉 20.8℃
  • 서울 27.9℃
  • 구름많음대전 28.0℃
  • 흐림대구 27.6℃
  • 구름많음울산 25.5℃
  • 구름조금광주 28.6℃
  • 구름조금부산 28.2℃
  • 구름조금고창 28.4℃
  • 구름많음제주 29.8℃
  • 흐림강화 26.6℃
  • 구름많음보은 23.2℃
  • 구름많음금산 27.2℃
  • 구름많음강진군 29.6℃
  • 구름많음경주시 26.8℃
  • 맑음거제 28.6℃
기상청 제공


IT일반


NC AI, 한국어 멀티모달 AI ‘VARCO-VISION 2.0’ 공개

[FETV=신동현 기자] NC AI가 한국어 기반 멀티모달 AI 모델 ‘VARCO-VISION 2.0’ 4종을 오픈소스로 공개했다고 16일 밝혔다.

 

공개된 모델은 14B, 1.7B, 1.7B OCR, Video-Embedding 등으로 이미지와 텍스트를 함께 이해하는 비전-언어모델(VLM)이다.

 

 

VARCO-VISION 2.0 14B 모델은 글로벌 오픈소스 VLM 중 최고 성능으로 알려진 InternVL3-14B, 알리바바 Ovis2-16B, Qwen2.5-VL 7B를 한국어와 영어 기준으로 모두 상회했다고 밝혔다. 14B와 임베딩 모델은 이날 공개됐으며, 1.7B와 OCR 모델은 차주 중 추가 공개될 예정이다.

 

이번 모델은 여러 장의 이미지를 동시에 분석하고 복잡한 문서, 표, 차트까지 처리할 수 있는 기능이 특징이다. 한국어 특화 성능을 기반으로 자연스러운 텍스트 생성과 한국 문화에 대한 이해도를 높였다.

 

14B 모델은 복잡한 멀티이미지 분석이 필요한 환경에 1.7B 모델은 스마트폰·PC 등 개인 기기에서 경량으로 동작할 수 있도록 설계됐다. OCR 특화 모델은 기존 OCR 대비 한국어 인식 능력을 강화하고 AnyRes 해상도 분할 입력 방식을 통해 다양한 해상도의 이미지를 효율적으로 처리할 수 있다.

 

멀티모달 임베딩 모델은 텍스트·이미지·비디오 간 의미 유사도를 고차원 임베딩 공간에서 계산하며, 영상 검색 벤치마크인 MultiVENT2.0에서도 최고 성능을 기록했다고 밝혔다. 검색 벡터를 이용한 구조로 별도 학습 없이도 검색 성능을 개선했다.

 

이번 모델은 금융, 교육, 문화, 제조 등 다양한 산업의 문서 자동화, 이미지 기반 검색, 콘텐츠 생성 등에 활용할 수 있다. NC AI는 데이터 효율성 측면에서도 고품질 데이터 선별과 합성 기술을 통해 적은 컴퓨팅 자원으로 학습 효율을 높였다고 설명했다.

 

이연수 NC AI 대표는 “기술 고도화로 글로벌 트렌드가 텍스트만 처리하는 언어모델을 넘어 비전 모델을 함께 활용하는 비전언어모델로 전환되고 있다”며 “이번 4종 모델 공개를 통해 미디어와 게임, 패션 등 버티컬 AI로 기존 국내 멀티모달 AI를 선도하는 NC AI가 비전언어모델에서도 한국의 주권을 지킬 수 있는 가능성을 확인했다”고 말했다.