article detail
[Tech & Now] 달파, 오픈AI 'MLE-벤치'서 종합 점수 79.11% 기록
2026. 5. 7. 오후 4:14
AI 요약
달파는 7일 오픈AI의 MLE-벤치에서 종합 점수 79.11%를 기록해 구글의 'CAIR MARS+'(62.67%)와 바이두의 'FM-Agent'(64.44%) 등 글로벌 빅테크 성과를 상회했다고 밝혔습니다. 이번 성과에는 자사 프레임워크 '코브라 에이전트'와 환경과 모델의 상호작용을 내부적으로 시뮬레이션해 미래 결과를 예측하는 '월드 모델' 방법론이 활용됐으며, 조만간 관련 연구 논문을 공식 발표할 예정입니다. 달파는 이 기술을 바탕으로 소비재(CPG) 브랜드용 '에이전틱 OS' 고도화에 주력해 신상품 기획부터 물류 최적화, 마케팅 실행까지 AI 에이전트가 자율 수행하도록 지원할 계획이라고 밝혔습니다.






