article detail
“화학ㆍ바이오 파운데이션 모델, 결국 데이터가 변수”… 특허 AI Ready Data 확보가 핵심 과제로
2026. 5. 20. 오전 11:14

AI 요약
정부가 'AI 3대 강국 도약'을 국정 핵심 과제로 내건 가운데 학습 데이터의 품질이 부각되며 화학·바이오 파운데이션 모델 구축에서 글로벌 특허 데이터를 AI 학습 가능한 형태로 구조화하는 작업이 핵심 과제로 떠올랐습니다. 특허 데이터는 본문·표·도면에 정보가 흩어져 있어 후보군별 변경 위치·핵심 변경 사항·주요 성능·생체 효과 등을 하나의 단위로 묶어야 AI 학습 자산이 되며, 이 공백을 파고든 워트인텔리전스는 변리사의 논리적 추론 흐름을 문장 구조화, 기술 핵심어 추출, 용어 간 관계 정의, 문제-해결 구조 모델링의 네 축으로 데이터셋화해 106개국 기반 1.7억 건의 특허 등 AI Ready Data 자산을 구축했습니다. 워트인텔리전스는 이를 바탕으로 도메인 특화 모델 '플루토LM'과 R&D 의사결정 지원 서비스 '키워트 인사이트'를 운영하고 딥엘·LG AI연구원과 협업하며 지식재산처 AX 사업과 산업통상자원부 'Tech-GPT' 프로젝트에 참여하고 있습니다.




![[IP 스타 칼럼] 셰익스피어의 깃펜과 프롬프트: AI 시대, 저작권이 그리는 새로운 미래](https://www.ipdaily.co.kr/wp-content/uploads/2026/04/이춘무-단장-칼럼-이미지.jpg)


