IT뉴스모아news terminal

article detail

AI 스타트업 클레비, GAIA 상위 2.5% 진입… 검증된 공신력 보여줘

v.daum.netAI스타트업LLM공신력검증모델개발벤치마크에이전트해외진출
2026. 4. 8. 오전 10:01
AI 스타트업 클레비, GAIA 상위 2.5% 진입… 검증된 공신력 보여줘

AI 요약

국내 AI 스타트업 클레비는 from scratch로 개발한 자체 모델과 에이전트로 메타 AI가 설계하고 허깅페이스가 운영하는 GAIA 벤치마크에서 전체 3,090개 등록 모델 기준 상위 2.5%에 진입했습니다. 클레비는 cip-5.5-agent(에이전틱 AI)와 cip-5.5-mm 등을 내부에서 독자 개발하고 외부 LLM API를 전혀 사용하지 않은 채 5개 에이전트를 출전시켜 전원 70점대(최고 79.07%, 최저 70.76%)를 기록했으며, 내부 재평가에서 웹상 정답 근거가 남아 있는 문항만 기준으로 정답률이 98% 이상으로 인간 평균 92%를 넘어섰습니다. 회사 측은 GAIA 리더보드 등재가 제3자 독립 평가에 따른 검증된 공신력을 부여해 투자 유치·해외 진출·B2B 영업 등에서 활용 가능한 객관적 근거가 된다고 설명했습니다.

원문보기
feed://articles/related관련 기사
네이버도 베팅한 AI 스타트업 인핸스…네이버 커머스 강화newsis.com
2026. 4. 20. 오전 11:40

네이버도 베팅한 AI 스타트업 인핸스…네이버 커머스 강화

AI스타트업전략적투자산업특화에이전트온톨로지멀티에이전트커머스강화글로벌확장
세종대 학술정보원, 제10회 학정포럼 개최… “AI 시대, 지능 활용 능력이 핵심 경쟁력”핀포인트뉴스
2026. 4. 19. 오전 10:24

세종대 학술정보원, 제10회 학정포럼 개최… “AI 시대, 지능 활용 능력이 핵심 경쟁력”

AILLMAGI트랜스포머에이전트자율주행AI리터러시프롬프트
AI, 희귀 언어까지 정복하나…제미나이, 키냐르완다어서 4.5점 이상 기록디지털투데이
2026. 4. 18. 오후 8:47

AI, 희귀 언어까지 정복하나…제미나이, 키냐르완다어서 4.5점 이상 기록

AI모델다국어LLM희귀언어벤치마크합성데이터언어성능문화맥락
멀티모달에 AI 인프라 구축…독파모 정예팀 개발 속도뉴스토마토
2026. 4. 17. 오후 4:13

멀티모달에 AI 인프라 구축…독파모 정예팀 개발 속도

AI파운데이션멀티모달비전언어모델LLMVLA에이전트AI인프라사이버보안
기업용 '클로드 오퍼스 4.7' 출시...근소한 차로 정상 탈환AI타임스
2026. 4. 17. 오전 8:21

기업용 '클로드 오퍼스 4.7' 출시...근소한 차로 정상 탈환

AI모델코딩성능멀티모달벤치마크에이전트토큰효율클라우드API환각감소
나현식 숭실대 교수 “안전성 낮은 국내 LLM, 퍼플티밍으로 점검해야”바이라인네트워크
2026. 4. 16. 오후 11:44

나현식 숭실대 교수 “안전성 낮은 국내 LLM, 퍼플티밍으로 점검해야”

LLMAI보안퍼플티밍레드티밍안전성검증생성형AI벤치마크한국어특화
서울대병원, 의사국시 96점 받은 의료AI 에이전트 '케이메드' 도입…GPU 부족은 한계전자신문
2026. 4. 15. 오후 5:00

서울대병원, 의사국시 96점 받은 의료AI 에이전트 '케이메드' 도입…GPU 부족은 한계

의료AILLM의사국시GPU병원업무자동화헬스케어에이전트
간판 바꾼 파수…조규곤 대표 "AI 기업으로 본격 변신…해외사업 차별점 있다"디지털데일리
2026. 4. 15. 오후 2:44

간판 바꾼 파수…조규곤 대표 "AI 기업으로 본격 변신…해외사업 차별점 있다"

AI기업LLM엔터프라이즈컨설팅해외진출거버넌스ROI데이터
[단독]코히어 창업자 "한국은 기업용 AI 비서 수요 넘쳐…통제 체계 필요"v.daum.net
2026. 4. 15. 오전 10:08

[단독]코히어 창업자 "한국은 기업용 AI 비서 수요 넘쳐…통제 체계 필요"

기업용AILLM에이전트챗봇AI비서언어모델워크플로통제체계
CNN, AI로 미디어 거래 바꾼다... 에이전트 광고 거래 본격화매드타임스
2026. 4. 15. 오전 12:00

CNN, AI로 미디어 거래 바꾼다... 에이전트 광고 거래 본격화

AI광고미디어거래자동화LLM에이전트디지털광고광고거래프로토콜
[단독] 韓 AI개발사 ‘유니콘 1호’…업스테이지의 ‘초지능’ 도전v.daum.net
2026. 4. 15. 오전 5:03

[단독] 韓 AI개발사 ‘유니콘 1호’…업스테이지의 ‘초지능’ 도전

AI스타트업유니콘거대언어모델LLM투자라운드AI솔루션GPU기업가치
[단독] 韓 AI개발사 ‘유니콘 1호’…업스테이지의 ‘초지능’ 도전중앙일보
2026. 4. 15. 오전 5:00

[단독] 韓 AI개발사 ‘유니콘 1호’…업스테이지의 ‘초지능’ 도전

AI스타트업유니콘거대언어모델시리즈C솔라LLMGPUB2C서비스