article detail
KDD 2026서 웹3 AI 성능 평가 논문 채택…'디마인드 벤치마크' 공개
2026. 5. 26. 오후 3:01
AI 요약
싱가포르 오픈소스 AI 연구기관 DMind AI가 아시아 연구진과 공동으로 개발한 디마인드 벤치마크 논문이 국제 학술대회 KDD 2026의 데이터셋 및 벤치마크 트랙에 채택됐다고 26일 밝혔습니다. 이 평가는 Web3·블록체인 분야의 대형언어모델 성능을 블록체인 기초 개념, 인프라, 스마트 컨트랙트, DeFi, DAO, NFT, 토큰 이코노믹스, 밈코인, 보안 취약점 등 9개 도메인과 스마트 컨트랙트 디버깅·온체인 수치 추론 같은 실무 과제로 정량화했으며, GPT-5 Medium이 전체 평균 77.63점으로 가장 높았지만 토큰 이코노믹스와 보안 분야에서는 다수 모델이 낮은 성능을 보였다고 밝혔습니다. 연구팀은 주요 상용 모델들이 Web3 전문 추론에서 여전히 한계를 보였고 DMind의 32B 오픈소스 모델은 비용 대비 성능에서 토큰 이코노믹스·보안 영역 등에서 대규모 범용 모델 대비 10~30% 수준의 비용으로 유사하거나 더 높은 성능을 기록했으며 DMind 모델은 현재 AI 금융 플랫폼 Minara에 적용돼 운영 중이라고 설명했습니다.



![신분증 없는 AI도 돈을 쓴다...디지털 지갑 시대의 도래[엠블록레터]](https://wimg.mk.co.kr/news/cms/202604/08/news-p.v1.20260408.1da7c87a4a1d47aa97c8598ac829d07b_P1.png)


