IT뉴스모아news terminal

article detail

Web3 특화 AI 벤치마크 ‘DMind Benchmark’, KDD 2026 공식 채택

이데일리AI모델LLM평가Web3벤치마크보안취약점블록체인스마트컨트랙트오픈소스
2026. 5. 26. 오후 2:48
Web3 특화 AI 벤치마크 ‘DMind Benchmark’, KDD 2026 공식 채택

AI 요약

싱가포르 기반 오픈소스 AI 연구기관 DMind AI가 아시아 주요 연구진과 공동 개발한 DMind Benchmark 논문이 KDD 2026의 Datasets & Benchmarks 트랙에 채택됐으며, 블록체인 기초 개념부터 인프라·스마트 컨트랙트·보안 취약점 등 총 9개 핵심 분야의 실제 환경 기반 문제를 포함해 Web3·블록체인 분야 LLM 성능을 검증하는 평가 체계를 제시했습니다. 연구팀은 GPT-5 시리즈, Claude, Gemini, DeepSeek, Grok, Qwen 등 총 31개 모델을 평가해 GPT-5 Medium이 평균 77.63점으로 최고점을 기록했으나 토큰 이코노믹스와 보안 취약점 분야에서는 다수 모델이 낮은 성능을 보이며 상용 모델들도 Web3 전문 추론에서는 한계를 드러냈습니다. 비용 대비 효율 측면에서는 DMind의 32B 오픈소스 모델이 토큰 이코노믹스와 보안 영역에서 대규모 범용 모델 대비 10~30% 수준의 비용으로 유사하거나 더 높은 성능을 보였고, DMind 모델은 현재 AI 금융 플랫폼 Minara(미나라)에 적용돼 운영 중입니다

원문보기
feed://articles/related관련 기사
DMind AI, Web3 특화 LLM 벤치마크 연구 공개네이트
2026. 5. 26. 오후 3:48

DMind AI, Web3 특화 LLM 벤치마크 연구 공개

LLM벤치마크Web3블록체인스마트컨트랙트DeFi오픈소스금융
KDD 2026서 웹3 AI 성능 평가 논문 채택…'디마인드 벤치마크' 공개네이트
2026. 5. 26. 오후 3:01

KDD 2026서 웹3 AI 성능 평가 논문 채택…'디마인드 벤치마크' 공개

웹3AI성능벤치마크블록체인대형언어모델스마트컨트랙트DeFi오픈소스
Web3 특화 AI 벤치마크 'DMind Benchmark', KDD 2026 공식 채택네이트
2026. 5. 26. 오후 2:50

Web3 특화 AI 벤치마크 'DMind Benchmark', KDD 2026 공식 채택

Web3AI벤치마크블록체인LLM스마트컨트랙트학술대회오픈소스평가체계
Web3 특화 AI 벤치마크 'DMind Benchmark', KDD 2026 공식 채택네이트
2026. 5. 26. 오후 2:50

Web3 특화 AI 벤치마크 'DMind Benchmark', KDD 2026 공식 채택

AI벤치마크Web3블록체인LLM스마트컨트랙트오픈소스학술대회성능평가
[현장] 미토스 충격파…"에이전틱 AI 체계, 선점이 곧 표준"v.daum.net
2026. 5. 26. 오후 2:38

[현장] 미토스 충격파…"에이전틱 AI 체계, 선점이 곧 표준"

AI모델보안취약점에이전틱AI사이버위협AI인증제로트러스트오픈소스글로벌표준
앤트로픽 '미토스', 한 달 만에 SW 보안 취약점 1만개 확인전자신문
2026. 5. 25. 오후 2:15

앤트로픽 '미토스', 한 달 만에 SW 보안 취약점 1만개 확인

AI모델보안취약점소프트웨어버그탐지오픈소스클라우드패치관리사이버보안
알리바바, ‘中 1위’ 차세대 AI 칩셋 ‘Qwen3.7’ 프리뷰 기습 공개… “美 턱밑 추격”글로벌이코노믹
2026. 5. 20. 오전 7:45

알리바바, ‘中 1위’ 차세대 AI 칩셋 ‘Qwen3.7’ 프리뷰 기습 공개… “美 턱밑 추격”

AI모델생성형AI대규모언어모델벤치마크오픈소스클라우드API칩셋
스토리, AI 에이전트 개발 지원 오픈소스 ‘스토리 스킬’ 공개인공지능신문
2026. 5. 6. 오후 5:47

스토리, AI 에이전트 개발 지원 오픈소스 ‘스토리 스킬’ 공개

AI에이전트오픈소스블록체인IP관리스마트컨트랙트SDK라이선싱로열티
딥시크, 플래그십 AI 'V4' 공개…"코딩 벤치마크서 최고 수준"v.daum.net
2026. 4. 24. 오후 4:29

딥시크, 플래그십 AI 'V4' 공개…"코딩 벤치마크서 최고 수준"

AI모델오픈소스코딩벤치마크컨텍스트어텐션토큰
오픈AI ‘GPT-5.5’ 내놓은 날...중국의 딥시크 V4도 출격했다v.daum.net
2026. 4. 24. 오후 4:09

오픈AI ‘GPT-5.5’ 내놓은 날...중국의 딥시크 V4도 출격했다

AI모델오픈소스추론효율파라미터컨텍스트벤치마크API중국AI
B.AI LLM 서비스 빠른 시작 가이드: 네 단계로 다양한 AI 대모델 대화 및 API 접속을 즐기고, 로그인하면 100,000 무료 AI 포인트를 받으세요链捕手ChainCatcher
2026. 4. 22. 오후 7:03

B.AI LLM 서비스 빠른 시작 가이드: 네 단계로 다양한 AI 대모델 대화 및 API 접속을 즐기고, 로그인하면 100,000 무료 AI 포인트를 받으세요

LLM서비스AI모델API접속대화형AIWeb3블록체인결제정산멀티모델
[글로벌] '수십조 인재 베팅 통했다?'...메타, 차세대 AI '뮤즈 스파크'로 반격 시동테크M
2026. 4. 11. 오후 1:54

[글로벌] '수십조 인재 베팅 통했다?'...메타, 차세대 AI '뮤즈 스파크'로 반격 시동

AI모델멀티모달추론능력이미지생성동영상벤치마크수익화오픈소스