article detail
김정희 이파피루스 대표 “AI 시대 '문서 데이터 관문'될 것”
2026. 4. 27. 오후 12:49

AI 요약
김정희 이파피루스 대표는 전자신문 인터뷰에서 PDF, 한글, 오피스 등 다양한 문서 파일에서 AI용 데이터를 추출하는 솔루션을 보유한 이파피루스의 오픈소스 PDF 추출 솔루션 파이뮤PDF(PyMuPDF)가 깃허브 기준 누적 다운로드 6억1000만회를 기록하고 디펜던츠(Dependents)에서 글로벌 PDF 라이브러리 1위를 차지했다고 밝혔습니다. 김 대표는 파이뮤PDF가 문서의 구조적 맥락을 유지하며 데이터를 추출해 RAG 및 LLM 구축을 위한 필수 전처리 라이브러리로 평가받고 있으며, 전 세계 비즈니스 정보의 80% 이상이 PDF 형식에 존재한다고 설명했습니다. 이파피루스는 오픈소스로 기술 선점을 통해 점유율을 확보한 뒤 글로벌 엔터프라이즈에 상용 라이선스를 판매하는 전략을 취하고 있으며 올해 초 골드만삭스와 계약을 체결했고 팔란티어·마이크로소프트가 고객이며 지난해 매출은 240억원, 이 중 70억원이 파이뮤PDF에서 나왔다고 밝혔습니다

![[김동현의 AI 시대와 한국의 선택] 〈1〉글로벌 AI 경쟁 구도와 한국의 대응 방향](https://img.etnews.com/news/article/2026/04/20/news-p.v1.20260420.42810970d3394db6ac4d3770be39a087_P3.png)
![[유철균의 ‘지방의 눈으로 AI읽기’] 국가 예산 추적업](https://www.yeongnam.com/mnt/file/202604/news-p.v1.20260110.98fed46e34534ed3ad9e770048155a9b_R.jpg)


