article detail
공공 HWPX 전환 본격화…이파피루스, ‘경량 AI 전처리’로 문서 데이터 시장 공략
2026. 5. 26. 오후 4:04

AI 요약
공공부문의 개방형 문서 포맷(HWPX) 전환이 본격화되는 가운데 이파피루스는 HWP와 HWPX를 함께 처리할 수 있는 AI 문서 데이터 추출 라이브러리 파이뮤PDF 프로를 기반으로 공공·기업 대상 AI 데이터 전처리 시장 공략에 나선다고 26일 밝혔다. 파이뮤PDF 프로는 파이썬 환경에서 애플리케이션 내부에 직접 적용되는 라이브러리 방식으로 별도 인프라 부담을 낮추고, 경량 환경에서도 표·이미지·다단 구성·목록 등을 인식해 AI 활용에 적합한 데이터로 변환하며 하이브리드 OCR로 실제 OCR이 필요한 영역만 선별 처리해 마크다운·JSON 형태로 구조화하고 메타데이터 기반 청크 생성 기능을 지원한다고 회사는 설명했다. 이파피루스는 향후 AI 에이전트 연계 데이터 기반 업무 환경으로 확장 가능성을 보고 있으며 김정희 이파피루스 대표는 공공 HWPX 전환이 중요한 출발점이지만 기존 HWP 문서를 함께 구조화해야 실질적인 AI 전환이 가능하다고 말했다.




구름 빅밸류 대표 "추론형 데이터 있어야 AI 제 기능"](https://cphoto.asiae.co.kr/listimglink/1/2026052207543673268_1779404075.jpg)


