IT뉴스모아news terminal

article detail

달파, 오픈AI 'MLE-벤치'서 글로벌 최고 수준 에이전트 성능 입증

전자신문AI에이전트물류최적화성능평가소비재에이전틱OS월드모델자가개선자율탐색
2026. 5. 7. 오후 12:32
달파, 오픈AI 'MLE-벤치'서 글로벌 최고 수준 에이전트 성능 입증

AI 요약

AI 에이전트 전문기업 달파는 오픈AI의 AI 에이전트 성능 평가 지표 MLE-벤치를 활용해 자체 기술력을 검증한 결과 자사의 코브라 에이전트가 종합 점수 79.11%를 기록해 구글의 CAIR MARS+(62.67%)와 바이두의 FM-Agent(64.44%) 등을 크게 웃돌았으며 일부 과제에서는 인간 참가자 1위의 성과를 넘었다고 7일 밝혔습니다. 달파는 이 성과가 월드 모델 방법론을 활용한 자율 탐색 및 자가 개선 역량을 객관적으로 증명한 결과라며 관련 연구 논문을 조만간 발표할 예정이라고 밝혔습니다. 달파는 이 기술력을 바탕으로 소비재(CPG) 브랜드용 에이전틱 OS 고도화에 나서고 있으며 에이전틱 OS는 내부의 파편화된 데이터를 통합해 신상품 기획부터 물류 최적화, 마케팅 실행까지 AI 에이전트가 전 과정을 자율 수행하는 시스템입니다.

원문보기
feed://articles/related관련 기사
달파, 오픈AI의 ‘MLE-벤치’서 글로벌 최고 수준 에이전트 성능 입증AI타임스
2026. 5. 7. 오후 4:35

달파, 오픈AI의 ‘MLE-벤치’서 글로벌 최고 수준 에이전트 성능 입증

AI에이전트벤치마크자율탐색자가개선월드모델에이전틱OS소비재브랜드
[Tech & Now] 달파, 오픈AI 'MLE-벤치'서 종합 점수 79.11% 기록ebn.co.kr
2026. 5. 7. 오후 4:14

[Tech & Now] 달파, 오픈AI 'MLE-벤치'서 종합 점수 79.11% 기록

AI에이전트벤치마크월드모델자율시스템머신러닝기술성과물류최적화마케팅자동화
앤트로픽, 머스크의 데이터센터 임차…AI사용한도 대폭 상향v.daum.net
2026. 5. 7. 오전 3:50

앤트로픽, 머스크의 데이터센터 임차…AI사용한도 대폭 상향

AI기업데이터센터GPU연산용량클로드코딩도구AI에이전트자가개선
달파 “AI 에이전트로 마케팅 효율 극대화… 커머스 운영 패러다임 바꾼다”AI타임스
2026. 5. 2. 오후 7:44

달파 “AI 에이전트로 마케팅 효율 극대화… 커머스 운영 패러다임 바꾼다”

AI에이전트마케팅자동화커머스데이터드리븐인플루언서멀티에이전트소비재SNS마케팅
날 본뜬 AI가 24시간 일한다…한컴, '트윈형 에이전틱 OS' 상반기 출시뉴시스
2026. 4. 23. 오후 4:37

날 본뜬 AI가 24시간 일한다…한컴, '트윈형 에이전틱 OS' 상반기 출시

AI에이전트디지털쌍둥이에이전틱OS자동화문서구조화지능형시스템업무자동화소프트웨어
AI가 AI를 정렬한다면…앤트로픽 ”일부 방법에서 인간보다 정확”AI타임스
2026. 4. 15. 오후 6:00

AI가 AI를 정렬한다면…앤트로픽 ”일부 방법에서 인간보다 정확”

AI정렬AI에이전트자동연구보상해킹성능평가인간감독범용AI연구효율
복잡한 과학 연구에선 과학자 못따라잡는 AIv.daum.net
2026. 4. 14. 오후 3:04

복잡한 과학 연구에선 과학자 못따라잡는 AI

AI에이전트과학연구성능평가자연과학벤치마크AI활용연구품질
AI 에이전트가 바꾸는 커머스 운영…달파·AWS·데이터브릭스, ‘소비재 브랜드 AX 서밋’ 개최테크42
2026. 4. 8. 오전 8:32

AI 에이전트가 바꾸는 커머스 운영…달파·AWS·데이터브릭스, ‘소비재 브랜드 AX 서밋’ 개최

AI에이전트커머스운영운영자동화의사결정소비재산업마케팅물류최적화데이터전략
구글, 개방형 AI 새 모델 '젬마4' 첫 공개이투데이
2026. 4. 3. 오전 10:26

구글, 개방형 AI 새 모델 '젬마4' 첫 공개

개방형AIAI에이전트경량모델상업이용성능평가
AI가 기술 기업 인력의 25%를 "없애버린다".Vietnam.vn
2026. 5. 9. 오후 1:24

AI가 기술 기업 인력의 25%를 "없애버린다".

AI에이전트블록체인감원인력구조암호화폐AI역량기술기업구독취소
코딩 한줄 없이 '뉴스 에이전트' 뚝딱…더존 메이커톤이 보여준 바이브 코딩의 미래전자신문
2026. 5. 9. 오후 12:00

코딩 한줄 없이 '뉴스 에이전트' 뚝딱…더존 메이커톤이 보여준 바이브 코딩의 미래

바이브코딩AI에이전트노코드메이커톤자연어프로그래밍뉴스큐레이션개발자도구생성형AI
엑소더스, 솔라나 기반 AI 에이전트용 스테이블코인 출시디지털투데이
2026. 5. 9. 오전 11:08

엑소더스, 솔라나 기반 AI 에이전트용 스테이블코인 출시

스테이블코인솔라나AI에이전트결제시스템암호화폐가상지갑블록체인