[FETV=신동현 기자] 한글과컴퓨터(이하 한컴)가 유럽 최대 PDF 기술 컨퍼런스 ‘PDF Days Europe 2025’에 참여해 자사의 AI 학습 데이터 추출 기술 ‘오픈데이터로더 PDF’를 공개했다고 19일 밝혔다.
PDF 협회(PDF Association)가 주최하는 이번 행사에서 한컴은 오픈소스 기반 전략을 소개하고, 글로벌 전문가들과 교류하며 협력 방안을 모색했다. 발표는 PDF 협회 이사이자 오픈소스 전문기업 듀얼랩(Dual Lab)의 보리스 두브로프 CEO가 맡아 기술적 신뢰도를 높였다.
![한컴은 독일서 열린 ‘PDF Days Europe 2025’서 자사의 AI 학습 데이터 추출 기술 ‘오픈데이터로더 PDF’를 공개했다. [사진 한글과컴퓨터]](http://www.fetv.co.kr/data/photos/20250938/art_17582475305313_6a1b43.jpg?iqs=0.6746399843076221)
‘오픈데이터로더 PDF’는 복잡한 PDF 문서에서 표, 이미지, 레이아웃을 분석해 JSON·마크다운·HTML 등 AI 학습에 적합한 형태로 변환하는 데이터 추출 엔진이다. 경량화된 SDK로 제공돼 다양한 AI 서비스와 쉽게 연동할 수 있다.
현장에서는 금융·공공기관 등 보안 환경에서도 오프라인 구동이 가능한 점과 향후 ‘프롬프트 인젝션’ 방지 등 AI 안전성 로드맵이 제시된 점이 주목받았다.
정지환 한컴 CTO는 “전 세계 개발자와 문서 처리 기술을 공유하고 함께 성장하기 위한 첫걸음”이라며 “라마인덱스, 제미나이 등 주요 AI 프레임워크와 호환성을 강화해 PDF 데이터 처리 분야에서 글로벌 리더십을 확보할 것”이라고 말했다.