[인더스트리뉴스 조창현 기자] 글로벌 개발자들이 보다 손쉽게 이용해 작업 효율을 높일 수 있는 통합 원스톱 플랫폼이 나왔다. 문서 AI 전문기업 이파피루스(대표 김정희)는 오픈소스 PDF 라이브러리 MuPDF 관련 웹사이트 ‘뮤피디에프닷컴’을 새롭게 단장했다고 20일 밝혔다. MuPDF는 이파피루스 자회사인 미국 아티펙스(Artifex)가 보유한 C언어 기반 오픈소스 라이브러리다.
이파피루스에 따르면 관련 라이브러리는 PDF, XPS 및 EPUB 문서 이미지 렌더링을 비롯해 PDF 변환·처리·추출 등 다양한 문서 작업에 폭넓게 사용된다. 특히 MuPDF 내 파이썬 바인딩인 PyMuPDF는 2016년 첫 출시 이후 전 세계서 6,000만번 이상 내려받아졌으며, 지난해에는 미국 오픈AI가 개발한 챗GPT에 대한 학습 및 문서 처리용으로도 공급된 바 있다.
새 단장을 마친 뮤피디에프닷컴은 그간 각기 다른 채널에 흩어져 있던 MuPDF 제품군을 한자리에 모아 정리했다. 이파피루스는 새로운 플랫폼은 2005년 첫 출시 이래 수차례에 걸쳐 업데이트 및 세분화된 MuPDF 시리즈 내 다양한 기능과 특성을 직관적인 디자인과 상세한 안내 자료를 통해 알기 쉽게 소개한다고 설명했다.
커뮤니케이션 기능도 강화됐다. 개발자 및 사용자들이 가진 의견을 활발히 공유할 수 있도록 지원하기 위해 사이트 내 깃허브(GitHub)를 도입했으며, 제품 및 서비스 이용자 피드백을 받기 위한 디스코드 채널을 개설했다.
신제품도 꾸준히 개발해 나갈 예정이다. 이파피루스는 기존 보유하고 있던 MuPDF 자바 바인딩 라이브러리 외에 Node.js 서버 애플리케이션에 초점을 맞춘 ‘MuPDF.js’, C#과 .NET(닷넷) 프레임워크를 사용하는 기업을 타겟으로 한 ‘뮤피디에프닷넷’ 등을 추후 출시해 제품 라인업을 확장해 나갈 계획이다.
LLM(대규모 언어 모델, Large Language Models) 특화 제품도 출시됐다. 이파피루스는 PyMuPDF 내에 탑재된 텍스트 추출 기능이 최근 LLM 및 RAG(Retrieval Augmented Generation) 개발자들 사이에서 인기를 끌고 있다면서 그럴듯한 오류나 거짓말을 결과로 도출하는 ‘AI 환각’ 현상을 완화해 주는 효과적인 기술이라고 강조했다. 특히 이파피루스는 관련 수요에 부응하기 위해 ‘PyMuPDF4LLM’도 새롭게 내놨다.
이파피루스 김정희 대표는 “MuPDF를 사용하는 데 필요한 모든 정보를 총망라하면서도 이용하기 쉽고 직관적이며, ”전 세계 개발자들과 언제든 소통할 수 있는 젊고 활기찬 플랫폼을 목표로 했다”며, “어떤 개발 환경에서든 자유자재로 MuPDF를 활용할 수 있도록 지속적인 제품 강화와 확장에 나설 것”이라고 말했다.
한편 이파피루스는 현재 다양한 언어 모델과 데이터 추출 기술을 개발해 AI 훈련 및 활용에 필수적인 솔루션을 제공하고 있다. 이파피루스는 미국 및 유럽, 일본 등에 있는 해외 자회사를 통해 글로벌 사업을 전개 중이며, 전체 매출 중 절반 정도를 해외 고객이 차지하고 있다고 전했다.