IT뉴스모아news terminal

article detail

달파, 오픈AI의 ‘MLE-벤치’서 글로벌 최고 수준 에이전트 성능 입증

AI타임스AI에이전트벤치마크소비재브랜드에이전틱OS월드모델자가개선자율탐색
2026. 5. 7. 오후 4:35
달파, 오픈AI의 ‘MLE-벤치’서 글로벌 최고 수준 에이전트 성능 입증

AI 요약

AI 에이전트 전문 달파(대표 김도균)는 오픈AI의 MLE-벤치에서 코브라 에이전트가 종합 점수 79.11%를 기록했다고 7일 밝혔습니다. 이 벤치는 캐글의 실제 비즈니스 과제 75개를 에이전트가 자율적으로 해결하는 능력을 측정하며, 달파의 성과는 구글 CAIR MARS+(62.67%), 바이두 FM-Agent(64.44%) 등을 크게 웃돌고 일부 과제에서는 인간 참가자 1위 성과를 넘어섰습니다. 달파는 이번 결과가 자체 프레임워크 코브라의 자율 탐색·자가 개선 역량과 월드 모델 방법론의 활용을 증명한다고 설명하며 연구 논문을 곧 공개하고 소비재 브랜드용 에이전틱 OS 고도화에 박차를 가하고 있다고 밝혔습니다.

원문보기
feed://articles/related관련 기사
달파, 오픈AI 'MLE-벤치'서 글로벌 최고 수준 에이전트 성능 입증전자신문
2026. 5. 7. 오후 12:32

달파, 오픈AI 'MLE-벤치'서 글로벌 최고 수준 에이전트 성능 입증

AI에이전트성능평가월드모델자율탐색자가개선에이전틱OS소비재물류최적화
[Tech & Now] 달파, 오픈AI 'MLE-벤치'서 종합 점수 79.11% 기록ebn.co.kr
2026. 5. 7. 오후 4:14

[Tech & Now] 달파, 오픈AI 'MLE-벤치'서 종합 점수 79.11% 기록

AI에이전트벤치마크월드모델자율시스템머신러닝기술성과물류최적화마케팅자동화
NVIDIA·ServiceNow, 기업용 자율 AI 에이전트 파트너십 확장NVIDIA Blog Korea
2026. 5. 7. 오후 12:24

NVIDIA·ServiceNow, 기업용 자율 AI 에이전트 파트너십 확장

AI에이전트자율시스템엔터프라이즈파트너십가속컴퓨팅거버넌스오픈모델벤치마크
앤트로픽, 머스크의 데이터센터 임차…AI사용한도 대폭 상향v.daum.net
2026. 5. 7. 오전 3:50

앤트로픽, 머스크의 데이터센터 임차…AI사용한도 대폭 상향

AI기업데이터센터GPU연산용량클로드코딩도구AI에이전트자가개선
에이아이웍스, 에이전트 신뢰성 검증 솔루션 ‘에이전트리거’ 출시AI타임스
2026. 4. 28. 오후 3:20

에이아이웍스, 에이전트 신뢰성 검증 솔루션 ‘에이전트리거’ 출시

AI에이전트신뢰성검증솔루션LLM평가컴플라이언스벤치마크한국어특화안전성검증
오픈AI ‘GPT-5.5’ 내놓은 날, 메타는 직원 8000명 감축 발표중앙일보
2026. 4. 25. 오전 1:27

오픈AI ‘GPT-5.5’ 내놓은 날, 메타는 직원 8000명 감축 발표

인공지능AI에이전트언어모델벤치마크감원빅테크코딩은퇴프로그램
덜 시켜도 알아서 일한다...오픈AI 수퍼앱 엔진 GPT-5.5 출시 [팩플]중앙일보
2026. 4. 24. 오후 4:08

덜 시켜도 알아서 일한다...오픈AI 수퍼앱 엔진 GPT-5.5 출시 [팩플]

인공지능AI에이전트언어모델벤치마크오픈AI안전조치코딩성능토큰최적화
날 본뜬 AI가 24시간 일한다…한컴, '트윈형 에이전틱 OS' 상반기 출시뉴시스
2026. 4. 23. 오후 4:37

날 본뜬 AI가 24시간 일한다…한컴, '트윈형 에이전틱 OS' 상반기 출시

AI에이전트디지털쌍둥이에이전틱OS자동화문서구조화지능형시스템업무자동화소프트웨어
복잡한 과학 연구에선 과학자 못따라잡는 AIv.daum.net
2026. 4. 14. 오후 3:04

복잡한 과학 연구에선 과학자 못따라잡는 AI

AI에이전트과학연구성능평가자연과학벤치마크AI활용연구품질
AI가 기술 기업 인력의 25%를 "없애버린다".Vietnam.vn
2026. 5. 9. 오후 1:24

AI가 기술 기업 인력의 25%를 "없애버린다".

AI에이전트블록체인감원인력구조암호화폐AI역량기술기업구독취소
코딩 한줄 없이 '뉴스 에이전트' 뚝딱…더존 메이커톤이 보여준 바이브 코딩의 미래전자신문
2026. 5. 9. 오후 12:00

코딩 한줄 없이 '뉴스 에이전트' 뚝딱…더존 메이커톤이 보여준 바이브 코딩의 미래

바이브코딩AI에이전트노코드메이커톤자연어프로그래밍뉴스큐레이션개발자도구생성형AI
엑소더스, 솔라나 기반 AI 에이전트용 스테이블코인 출시디지털투데이
2026. 5. 9. 오전 11:08

엑소더스, 솔라나 기반 AI 에이전트용 스테이블코인 출시

스테이블코인솔라나AI에이전트결제시스템암호화폐가상지갑블록체인