IT뉴스모아news terminal

article detail

KDD 2026서 웹3 AI 성능 평가 논문 채택…'디마인드 벤치마크' 공개

네이트AI성능DeFi대형언어모델벤치마크블록체인스마트컨트랙트오픈소스웹3

2026. 5. 26. 오후 3:01

KDD 2026서 웹3 AI 성능 평가 논문 채택…'디마인드 벤치마크' 공개

AI 요약

싱가포르 오픈소스 AI 연구기관 DMind AI가 아시아 연구진과 공동으로 개발한 디마인드 벤치마크 논문이 국제 학술대회 KDD 2026의 데이터셋 및 벤치마크 트랙에 채택됐다고 26일 밝혔습니다. 이 평가는 Web3·블록체인 분야의 대형언어모델 성능을 블록체인 기초 개념, 인프라, 스마트 컨트랙트, DeFi, DAO, NFT, 토큰 이코노믹스, 밈코인, 보안 취약점 등 9개 도메인과 스마트 컨트랙트 디버깅·온체인 수치 추론 같은 실무 과제로 정량화했으며, GPT-5 Medium이 전체 평균 77.63점으로 가장 높았지만 토큰 이코노믹스와 보안 분야에서는 다수 모델이 낮은 성능을 보였다고 밝혔습니다. 연구팀은 주요 상용 모델들이 Web3 전문 추론에서 여전히 한계를 보였고 DMind의 32B 오픈소스 모델은 비용 대비 성능에서 토큰 이코노믹스·보안 영역 등에서 대규모 범용 모델 대비 10~30% 수준의 비용으로 유사하거나 더 높은 성능을 기록했으며 DMind 모델은 현재 AI 금융 플랫폼 Minara에 적용돼 운영 중이라고 설명했습니다.

DMind AI, Web3 특화 LLM 벤치마크 연구 공개

2026. 5. 26. 오후 3:48

DMind AI, Web3 특화 LLM 벤치마크 연구 공개

LLM벤치마크Web3블록체인스마트컨트랙트DeFi오픈소스금융

Web3 특화 AI 벤치마크 ‘DMind Benchmark’, KDD 2026 공식 채택

2026. 5. 26. 오후 2:48

Web3 특화 AI 벤치마크 ‘DMind Benchmark’, KDD 2026 공식 채택

LLM평가Web3블록체인벤치마크스마트컨트랙트오픈소스AI모델보안취약점

Web3 특화 AI 벤치마크 'DMind Benchmark', KDD 2026 공식 채택

2026. 5. 26. 오후 2:50

Web3 특화 AI 벤치마크 'DMind Benchmark', KDD 2026 공식 채택

Web3AI벤치마크블록체인LLM스마트컨트랙트학술대회오픈소스평가체계

Web3 특화 AI 벤치마크 'DMind Benchmark', KDD 2026 공식 채택

2026. 5. 26. 오후 2:50

Web3 특화 AI 벤치마크 'DMind Benchmark', KDD 2026 공식 채택

AI벤치마크Web3블록체인LLM스마트컨트랙트오픈소스학술대회성능평가

한국 스타트업 비드래프트, GPU 추가 학습 없이 글로벌 AI 추론 성능 3위 기록

2026. 5. 19. 오후 1:40

한국 스타트업 비드래프트, GPU 추가 학습 없이 글로벌 AI 추론 성능 3위 기록

대형언어모델모델병합추론성능AI기술스타트업특허출원오픈소스벤치마크

스토리, AI 에이전트 개발 지원 오픈소스 ‘스토리 스킬’ 공개

인공지능신문

2026. 5. 6. 오후 5:47

스토리, AI 에이전트 개발 지원 오픈소스 ‘스토리 스킬’ 공개

AI에이전트오픈소스블록체인IP관리스마트컨트랙트SDK라이선싱로열티

신분증 없는 AI도 돈을 쓴다...디지털 지갑 시대의 도래[엠블록레터]

매일경제 마켓

2026. 4. 8. 오후 5:46

신분증 없는 AI도 돈을 쓴다...디지털 지갑 시대의 도래[엠블록레터]

AI결제블록체인디지털지갑스테이블코인스마트컨트랙트오픈소스결제표준금융보안

루닛, 엔비디아 'AI 생태계 간담회' 참석…“의료 협력 가능성 논의”

2026. 6. 8. 오후 1:51

루닛, 엔비디아 'AI 생태계 간담회' 참석…“의료 협력 가능성 논의”

의료AI파운데이션모델소버린AI엔비디아오픈소스임상추론의사결정지원벤치마크

루닛, 엔비디아 'AI 에코시스템 간담회' 참석… 의료AI 글로벌 협력 논의

파이낸스스코프

2026. 6. 8. 오후 1:06

루닛, 엔비디아 'AI 에코시스템 간담회' 참석… 의료AI 글로벌 협력 논의

의료AI파운데이션모델소버린AI암검진엔비디아오픈소스글로벌협력벤치마크

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

2026. 6. 4. 오후 12:49

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

대규모언어모델AI안전성벤치마크다국어평가문화민감성LLM평가AI보안오픈소스

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증" — IT뉴스모아

news.dlwlrmaon.com

2026. 6. 3. 오후 6:03

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증" — IT뉴스모아

LLM벤치마크안전성다국어문화민감성오픈소스평가도구언어모델

중국, 2035년 '지식재산 세계 1위' 정조준…AI·표준특허 규제 정비 본격화

2026. 6. 4. 오후 5:00

중국, 2035년 '지식재산 세계 1위' 정조준…AI·표준특허 규제 정비 본격화

지식재산AI규제표준특허저작권영업비밀블록체인오픈소스기술사업화