IT뉴스모아news terminal

article detail

Web3 특화 AI 벤치마크 'DMind Benchmark', KDD 2026 공식 채택

네이트AI벤치마크LLMWeb3블록체인성능평가스마트컨트랙트오픈소스학술대회
2026. 5. 26. 오후 2:50
Web3 특화 AI 벤치마크 'DMind Benchmark', KDD 2026 공식 채택

AI 요약

싱가포르 기반 오픈소스 AI 연구기관 DMind AI가 아시아 주요 연구진과 공동 개발한 DMind Benchmark 논문이 오는 8월 제주에서 열리는 국제 학술대회 KDD 2026의 Datasets & Benchmarks 트랙에 채택됐으며, 이 평가지표는 블록체인 기초 개념부터 인프라·스마트 컨트랙트·보안 취약점 등 총 9개 핵심 분야와 스마트 컨트랙트 디버깅·온체인 수치 추론 등 실제 환경 기반 문제를 포함해 Web3·블록체인 산업 전반에서 LLM 성능을 검증하도록 설계됐습니다. 연구팀은 GPT-5 시리즈, Claude, Gemini, DeepSeek, Grok, Qwen 등 총 31개 모델을 평가해 GPT-5 Medium이 평균 77.63점으로 최고점을 기록했으나 토큰 이코노믹스와 보안 취약점 영역에서는 다수 모델이 낮은 성능을 보였고 일부 상용 모델이 Web3 전문 추론에서 한계를 드러냈으며, DMind의 32B 오픈소스 모델은 10~30% 수준의 비용으로 유사하거나 더 높은 성능을 보였고 해당 DMind 모델은 현재 AI 금융 플랫폼 Minara에 적용돼 운영 중입니다.

원문보기
feed://articles/related관련 기사
Web3 특화 AI 벤치마크 'DMind Benchmark', KDD 2026 공식 채택네이트
2026. 5. 26. 오후 2:50

Web3 특화 AI 벤치마크 'DMind Benchmark', KDD 2026 공식 채택

Web3AI벤치마크블록체인LLM스마트컨트랙트학술대회오픈소스평가체계
DMind AI, Web3 특화 LLM 벤치마크 연구 공개네이트
2026. 5. 26. 오후 3:48

DMind AI, Web3 특화 LLM 벤치마크 연구 공개

LLM벤치마크Web3블록체인스마트컨트랙트DeFi오픈소스금융
Web3 특화 AI 벤치마크 ‘DMind Benchmark’, KDD 2026 공식 채택이데일리
2026. 5. 26. 오후 2:48

Web3 특화 AI 벤치마크 ‘DMind Benchmark’, KDD 2026 공식 채택

LLM평가Web3블록체인벤치마크스마트컨트랙트오픈소스AI모델보안취약점
KDD 2026서 웹3 AI 성능 평가 논문 채택…'디마인드 벤치마크' 공개네이트
2026. 5. 26. 오후 3:01

KDD 2026서 웹3 AI 성능 평가 논문 채택…'디마인드 벤치마크' 공개

웹3AI성능벤치마크블록체인대형언어모델스마트컨트랙트DeFi오픈소스
스토리, AI 에이전트 개발 지원 오픈소스 ‘스토리 스킬’ 공개인공지능신문
2026. 5. 6. 오후 5:47

스토리, AI 에이전트 개발 지원 오픈소스 ‘스토리 스킬’ 공개

AI에이전트오픈소스블록체인IP관리스마트컨트랙트SDK라이선싱로열티
신분증 없는 AI도 돈을 쓴다...디지털 지갑 시대의 도래[엠블록레터]매일경제 마켓
2026. 4. 8. 오후 5:46

신분증 없는 AI도 돈을 쓴다...디지털 지갑 시대의 도래[엠블록레터]

AI결제블록체인디지털지갑스테이블코인스마트컨트랙트오픈소스결제표준금융보안
LLM 도입 전 체크리스트 27가지itworld.co.kr
2026. 4. 8. 오전 9:15

LLM 도입 전 체크리스트 27가지

LLM모델선택성능평가추론속도컨텍스트미세조정오픈소스배포검토
中 상하이자오퉁대, ‘AI 모델이 다른 AI 모델 비판’ 자율연구 시스템 개발로봇신문
2026. 5. 25. 오후 8:14

中 상하이자오퉁대, ‘AI 모델이 다른 AI 모델 비판’ 자율연구 시스템 개발

AI에이전트자율연구적대적검증LLM오픈소스다중에이전트연구자동화상호검증
LLM 효율화 경쟁 속 비드래프트, AI 프레임워크 기술 공개한경매거진&북
2026. 5. 22. 오후 2:52

LLM 효율화 경쟁 속 비드래프트, AI 프레임워크 기술 공개

LLM추론성능모델병합프레임워크AI스타트업파라미터융합특허출원성능평가
비드래프트 LLM ‘다윈 패밀리’, GPU 학습 없이 세계 3위 기록데이터넷
2026. 5. 22. 오후 1:36

비드래프트 LLM ‘다윈 패밀리’, GPU 학습 없이 세계 3위 기록

LLM모델병합추론성능GPU학습다윈패밀리특허출원양자화오픈소스
나무기술-레드햇, 엔터프라이즈 에이전틱 AI 플랫폼 공동 개발테크월드
2026. 5. 20. 오후 3:33

나무기술-레드햇, 엔터프라이즈 에이전틱 AI 플랫폼 공동 개발

AI플랫폼에이전트엔터프라이즈오픈소스클라우드GPULLM보안
LLM 검열 제거 도구 '헤레틱' 등장BI KOREA
2026. 5. 19. 오전 11:59

LLM 검열 제거 도구 '헤레틱' 등장

LLM검열제거오픈소스안전장치프롬프트벡터제거트랜스포머윤리논란