article detail
Web3 특화 AI 벤치마크 'DMind Benchmark', KDD 2026 공식 채택
2026. 5. 26. 오후 2:50
AI 요약
싱가포르 기반 오픈소스 AI 연구기관 DMind AI가 아시아 주요 연구진과 공동 개발한 DMind Benchmark 논문이 오는 8월 제주에서 열리는 국제 학술대회 KDD 2026의 Datasets & Benchmarks 트랙에 채택됐습니다. DMind Benchmark는 블록체인 기초 개념부터 인프라, 스마트 컨트랙트, 보안 취약점 등 총 9개 핵심 분야와 스마트 컨트랙트 디버깅·온체인 수치 추론 등의 실제 환경 기반 문제를 포함해 블록체인·Web3 분야 대형언어모델(LLM)의 성능을 검증하는 평가 체계를 제시했습니다. 연구팀은 GPT-5 시리즈, Claude, Gemini, DeepSeek, Grok, Qwen 등 총 31개 모델을 평가해 GPT-5 Medium이 평균 77.63점으로 최고 성적을 기록했으나 토큰 이코노믹스와 보안 취약점 영역에서는 성능 편차가 컸고, 일부 32B 파라미터 오픈소스 모델은 10~30% 수준의 비용으로 유사하거나 더 높은 성능을 보였으며 DMind 모델은 AI 금융 플랫폼 Minara에 적용돼 운영 중입니다.


![신분증 없는 AI도 돈을 쓴다...디지털 지갑 시대의 도래[엠블록레터]](https://wimg.mk.co.kr/news/cms/202604/08/news-p.v1.20260408.1da7c87a4a1d47aa97c8598ac829d07b_P1.png)


![정유신 교수 "LLM 통한 AI 금융인프라 혁명 필요…5대 금융인프라 전 영역의 고도화 이끌 것" [2026한국금융미래포럼]](https://cfnimage.commutil.kr/phpwas/restmb_allidxmake.php?pp=002&idx=999&simg=202605191545180211207c96e797802112162137.jpg&nmt=18)