IT뉴스모아news terminal

article detail

Web3 특화 AI 벤치마크 ‘DMind Benchmark’, KDD 2026 공식 채택

이데일리AI모델LLM평가Web3벤치마크보안취약점블록체인스마트컨트랙트오픈소스

2026. 5. 26. 오후 2:48

Web3 특화 AI 벤치마크 ‘DMind Benchmark’, KDD 2026 공식 채택

AI 요약

싱가포르 기반 오픈소스 AI 연구기관 DMind AI가 아시아 주요 연구진과 공동 개발한 DMind Benchmark 논문이 KDD 2026의 Datasets & Benchmarks 트랙에 채택됐으며, 블록체인 기초 개념부터 인프라·스마트 컨트랙트·보안 취약점 등 총 9개 핵심 분야의 실제 환경 기반 문제를 포함해 Web3·블록체인 분야 LLM 성능을 검증하는 평가 체계를 제시했습니다. 연구팀은 GPT-5 시리즈, Claude, Gemini, DeepSeek, Grok, Qwen 등 총 31개 모델을 평가해 GPT-5 Medium이 평균 77.63점으로 최고점을 기록했으나 토큰 이코노믹스와 보안 취약점 분야에서는 다수 모델이 낮은 성능을 보이며 상용 모델들도 Web3 전문 추론에서는 한계를 드러냈습니다. 비용 대비 효율 측면에서는 DMind의 32B 오픈소스 모델이 토큰 이코노믹스와 보안 영역에서 대규모 범용 모델 대비 10~30% 수준의 비용으로 유사하거나 더 높은 성능을 보였고, DMind 모델은 현재 AI 금융 플랫폼 Minara(미나라)에 적용돼 운영 중입니다

DMind AI, Web3 특화 LLM 벤치마크 연구 공개

2026. 5. 26. 오후 3:48

DMind AI, Web3 특화 LLM 벤치마크 연구 공개

LLM벤치마크Web3블록체인스마트컨트랙트DeFi오픈소스금융

KDD 2026서 웹3 AI 성능 평가 논문 채택…'디마인드 벤치마크' 공개

2026. 5. 26. 오후 3:01

KDD 2026서 웹3 AI 성능 평가 논문 채택…'디마인드 벤치마크' 공개

웹3AI성능벤치마크블록체인대형언어모델스마트컨트랙트DeFi오픈소스

Web3 특화 AI 벤치마크 'DMind Benchmark', KDD 2026 공식 채택

2026. 5. 26. 오후 2:50

Web3 특화 AI 벤치마크 'DMind Benchmark', KDD 2026 공식 채택

Web3AI벤치마크블록체인LLM스마트컨트랙트학술대회오픈소스평가체계

Web3 특화 AI 벤치마크 'DMind Benchmark', KDD 2026 공식 채택

2026. 5. 26. 오후 2:50

Web3 특화 AI 벤치마크 'DMind Benchmark', KDD 2026 공식 채택

AI벤치마크Web3블록체인LLM스마트컨트랙트오픈소스학술대회성능평가

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

2026. 6. 4. 오후 12:49

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

대규모언어모델AI안전성벤치마크다국어평가문화민감성LLM평가AI보안오픈소스

[현장] 미토스 충격파…"에이전틱 AI 체계, 선점이 곧 표준"

2026. 5. 26. 오후 2:38

[현장] 미토스 충격파…"에이전틱 AI 체계, 선점이 곧 표준"

AI모델보안취약점에이전틱AI사이버위협AI인증제로트러스트오픈소스글로벌표준

앤트로픽 '미토스', 한 달 만에 SW 보안 취약점 1만개 확인

2026. 5. 25. 오후 2:15

앤트로픽 '미토스', 한 달 만에 SW 보안 취약점 1만개 확인

AI모델보안취약점소프트웨어버그탐지오픈소스클라우드패치관리사이버보안

알리바바, ‘中 1위’ 차세대 AI 칩셋 ‘Qwen3.7’ 프리뷰 기습 공개… “美 턱밑 추격”

글로벌이코노믹

2026. 5. 20. 오전 7:45

알리바바, ‘中 1위’ 차세대 AI 칩셋 ‘Qwen3.7’ 프리뷰 기습 공개… “美 턱밑 추격”

AI모델생성형AI대규모언어모델벤치마크오픈소스클라우드API칩셋

스토리, AI 에이전트 개발 지원 오픈소스 ‘스토리 스킬’ 공개

인공지능신문

2026. 5. 6. 오후 5:47

스토리, AI 에이전트 개발 지원 오픈소스 ‘스토리 스킬’ 공개

AI에이전트오픈소스블록체인IP관리스마트컨트랙트SDK라이선싱로열티

딥시크, 플래그십 AI 'V4' 공개…"코딩 벤치마크서 최고 수준"

2026. 4. 24. 오후 4:29

딥시크, 플래그십 AI 'V4' 공개…"코딩 벤치마크서 최고 수준"

AI모델오픈소스코딩벤치마크컨텍스트어텐션토큰

오픈AI ‘GPT-5.5’ 내놓은 날...중국의 딥시크 V4도 출격했다

2026. 4. 24. 오후 4:09

오픈AI ‘GPT-5.5’ 내놓은 날...중국의 딥시크 V4도 출격했다

AI모델오픈소스추론효율파라미터컨텍스트벤치마크API중국AI

B.AI LLM 서비스 빠른 시작 가이드: 네 단계로 다양한 AI 대모델 대화 및 API 접속을 즐기고, 로그인하면 100,000 무료 AI 포인트를 받으세요

链捕手ChainCatcher

2026. 4. 22. 오후 7:03

B.AI LLM 서비스 빠른 시작 가이드: 네 단계로 다양한 AI 대모델 대화 및 API 접속을 즐기고, 로그인하면 100,000 무료 AI 포인트를 받으세요

LLM서비스AI모델API접속대화형AIWeb3블록체인결제정산멀티모델