[FETV=신동현 기자] 한글과컴퓨터는 자사의 PDF 데이터 추출 기술 ‘오픈데이터로더 PDF(OpenDataLoader PDF)’가 글로벌 AI 개발 프레임워크 ‘랭체인(LangChain)’의 공식 구성요소로 등록됐다고 3일 밝혔다.
랭체인은 챗GPT 등 대규모 언어모델(LLM) 기반 AI 서비스를 구축할 때 가장 널리 사용되는 오픈소스 프레임워크로 전 세계 수십만명의 개발자가 활용하는 사실상 표준 도구로 평가받는다.
‘오픈데이터로더 PDF’는 PDF 문서 내 텍스트, 표, 이미지 등 비정형 데이터를 빠르고 정확하게 추출해 AI 모델이 학습·활용 가능한 형태로 변환하는 기술이다. AI 학습 과정에서 반복적으로 발생해온 데이터 병목 문제를 해결할 수 있는 솔루션으로, 문서 데이터 처리 효율을 크게 높인 것이 특징이다.
한컴은 이번 등록으로 전 세계 AI 개발자들에게 신뢰성 높은 PDF 데이터 처리 기술을 직접 제공할 수 있게 됐다. 이를 통해 문서 기술 분야에서 글로벌 AI 표준 프레임워크에 기여하며 기술 리더십을 강화할 방침이다.
정지환 한컴 최고기술책임자(CTO)는 “랭체인 공식 등록은 한컴의 문서 처리 기술력이 글로벌 AI 개발 표준으로 인정받은 중요한 성과”라며 “전 세계 개발자들이 활발히 사용하는 프레임워크에 직접 통합된 만큼 AI 시대 데이터 활용의 어려움을 해결하는 데 실질적인 역할을 하게 될 것”이라고 말했다.



