IT뉴스모아news terminal

article detail

Web3 특화 AI 벤치마크 'DMind Benchmark', KDD 2026 공식 채택

네이트AI벤치마크LLMWeb3블록체인성능평가스마트컨트랙트오픈소스학술대회

2026. 5. 26. 오후 2:50

Web3 특화 AI 벤치마크 'DMind Benchmark', KDD 2026 공식 채택

AI 요약

싱가포르 기반 오픈소스 AI 연구기관 DMind AI가 아시아 주요 연구진과 공동 개발한 DMind Benchmark 논문이 오는 8월 제주에서 열리는 국제 학술대회 KDD 2026의 Datasets & Benchmarks 트랙에 채택됐으며, 이 평가지표는 블록체인 기초 개념부터 인프라·스마트 컨트랙트·보안 취약점 등 총 9개 핵심 분야와 스마트 컨트랙트 디버깅·온체인 수치 추론 등 실제 환경 기반 문제를 포함해 Web3·블록체인 산업 전반에서 LLM 성능을 검증하도록 설계됐습니다. 연구팀은 GPT-5 시리즈, Claude, Gemini, DeepSeek, Grok, Qwen 등 총 31개 모델을 평가해 GPT-5 Medium이 평균 77.63점으로 최고점을 기록했으나 토큰 이코노믹스와 보안 취약점 영역에서는 다수 모델이 낮은 성능을 보였고 일부 상용 모델이 Web3 전문 추론에서 한계를 드러냈으며, DMind의 32B 오픈소스 모델은 10~30% 수준의 비용으로 유사하거나 더 높은 성능을 보였고 해당 DMind 모델은 현재 AI 금융 플랫폼 Minara에 적용돼 운영 중입니다.

Web3 특화 AI 벤치마크 'DMind Benchmark', KDD 2026 공식 채택

2026. 5. 26. 오후 2:50

Web3 특화 AI 벤치마크 'DMind Benchmark', KDD 2026 공식 채택

Web3AI벤치마크블록체인LLM스마트컨트랙트학술대회오픈소스평가체계

DMind AI, Web3 특화 LLM 벤치마크 연구 공개

2026. 5. 26. 오후 3:48

DMind AI, Web3 특화 LLM 벤치마크 연구 공개

LLM벤치마크Web3블록체인스마트컨트랙트DeFi오픈소스금융

Web3 특화 AI 벤치마크 ‘DMind Benchmark’, KDD 2026 공식 채택

2026. 5. 26. 오후 2:48

Web3 특화 AI 벤치마크 ‘DMind Benchmark’, KDD 2026 공식 채택

LLM평가Web3블록체인벤치마크스마트컨트랙트오픈소스AI모델보안취약점

업스테이지, 독파모 '중간 모델'로 국내 첫 AA 40점대 돌파

2026. 6. 1. 오전 8:59

업스테이지, 독파모 '중간 모델'로 국내 첫 AA 40점대 돌파

언어모델파운데이션중간모델성능평가AI벤치마크국내개발오픈소스모델경쟁

KDD 2026서 웹3 AI 성능 평가 논문 채택…'디마인드 벤치마크' 공개

2026. 5. 26. 오후 3:01

KDD 2026서 웹3 AI 성능 평가 논문 채택…'디마인드 벤치마크' 공개

웹3AI성능벤치마크블록체인대형언어모델스마트컨트랙트DeFi오픈소스

스토리, AI 에이전트 개발 지원 오픈소스 ‘스토리 스킬’ 공개

인공지능신문

2026. 5. 6. 오후 5:47

스토리, AI 에이전트 개발 지원 오픈소스 ‘스토리 스킬’ 공개

AI에이전트오픈소스블록체인IP관리스마트컨트랙트SDK라이선싱로열티

신분증 없는 AI도 돈을 쓴다...디지털 지갑 시대의 도래[엠블록레터]

매일경제 마켓

2026. 4. 8. 오후 5:46

신분증 없는 AI도 돈을 쓴다...디지털 지갑 시대의 도래[엠블록레터]

AI결제블록체인디지털지갑스테이블코인스마트컨트랙트오픈소스결제표준금융보안

LLM 도입 전 체크리스트 27가지

2026. 4. 8. 오전 9:15

LLM 도입 전 체크리스트 27가지

LLM모델선택성능평가추론속도컨텍스트미세조정오픈소스배포검토

서울대 찾은 젠슨 황 "K만 붙이면 유명해진다…나는 K-젠슨"

연합인포맥스

2026. 6. 8. 오후 1:01

서울대 찾은 젠슨 황 "K만 붙이면 유명해진다…나는 K-젠슨"

AI엔비디아칩설계LLM오픈소스로봇에이전트신약개발

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증" — IT뉴스모아

news.dlwlrmaon.com

2026. 6. 3. 오후 6:03

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증" — IT뉴스모아

LLM벤치마크안전성다국어문화민감성오픈소스평가도구언어모델

네이버클라우드, 국내 기업 최초 엔비디아 AI 개발 연합체 참여

2026. 6. 5. 오전 8:52

네이버클라우드, 국내 기업 최초 엔비디아 AI 개발 연합체 참여

AI개발오픈소스생성형AILLM클라우드기술협력모델최적화

중국, 2035년 '지식재산 세계 1위' 정조준…AI·표준특허 규제 정비 본격화

2026. 6. 4. 오후 5:00

중국, 2035년 '지식재산 세계 1위' 정조준…AI·표준특허 규제 정비 본격화

지식재산AI규제표준특허저작권영업비밀블록체인오픈소스기술사업화