IT뉴스모아news terminal

article detail

AI 스타트업 클레비, GAIA 상위 2.5% 진입… 검증된 공신력 보여줘

v.daum.netAI스타트업LLM공신력검증모델개발벤치마크에이전트해외진출

2026. 4. 8. 오전 10:01

AI 스타트업 클레비, GAIA 상위 2.5% 진입… 검증된 공신력 보여줘

AI 요약

국내 AI 스타트업 클레비는 from scratch로 개발한 자체 모델과 에이전트로 메타 AI가 설계하고 허깅페이스가 운영하는 GAIA 벤치마크에서 전체 3,090개 등록 모델 기준 상위 2.5%에 진입했습니다. 클레비는 cip-5.5-agent(에이전틱 AI)와 cip-5.5-mm 등을 내부에서 독자 개발하고 외부 LLM API를 전혀 사용하지 않은 채 5개 에이전트를 출전시켜 전원 70점대(최고 79.07%, 최저 70.76%)를 기록했으며, 내부 재평가에서 웹상 정답 근거가 남아 있는 문항만 기준으로 정답률이 98% 이상으로 인간 평균 92%를 넘어섰습니다. 회사 측은 GAIA 리더보드 등재가 제3자 독립 평가에 따른 검증된 공신력을 부여해 투자 유치·해외 진출·B2B 영업 등에서 활용 가능한 객관적 근거가 된다고 설명했습니다.

아크릴, AWS 협력 발판 삼아 의료·AI 인프라 해외 시장 확대

2026. 6. 4. 오전 11:43

아크릴, AWS 협력 발판 삼아 의료·AI 인프라 해외 시장 확대

GPU최적화의료AILLMEMR플랫폼클라우드인프라해외진출벤치마크의료특화

친사회성 역대 최고… 앤트로픽, ‘클로드 오푸스 4.8’ 출시

디지털 인사이트 DIGITAL iNSIGHT

2026. 5. 29. 오후 2:11

친사회성 역대 최고… 앤트로픽, ‘클로드 오푸스 4.8’ 출시

LLM생성형AI클로드할루시네이션에이전트코딩벤치마크

“박사급이라면서 왜 이렇게 답답하죠?”···AI 성능 측정, 이젠 ‘일머리’도 따진다 [경제밥도둑]

2026. 5. 27. 오전 7:01

“박사급이라면서 왜 이렇게 답답하죠?”···AI 성능 측정, 이젠 ‘일머리’도 따진다 [경제밥도둑]

AI성능측정벤치마크에이전트코딩능력추론능력실전평가성능괴리LLM

AI 스타트업 서치독, 10억원 규모 시드투자 유치

아시아경제

2026. 4. 28. 오전 8:52

AI 스타트업 서치독, 10억원 규모 시드투자 유치

AI스타트업시드투자문서분석LLM제품개발해외진출자금조달건설IT

오픈AI, ‘일하는 AI’ GPT-5.5 전격 공개…“코딩·리서치 스스로 척척”

2026. 4. 24. 오전 10:24

오픈AI, ‘일하는 AI’ GPT-5.5 전격 공개…“코딩·리서치 스스로 척척”

생성AI에이전트LLM코딩리서치벤치마크보안API

오픈AI, 에이전트 능력서 '미소스' 꺾은 GPT-5.5 출시...세계 1위 탈환

2026. 4. 24. 오전 7:12

오픈AI, 에이전트 능력서 '미소스' 꺾은 GPT-5.5 출시...세계 1위 탈환

생성형AILLM에이전트벤치마크API멀티모달추론능력토큰가격

문샷AI, 오픈소스 LLM 키미-K2.6 출시…"GPT-5.4·클로드 오퍼스 4.6 능가"

2026. 4. 21. 오후 2:58

문샷AI, 오픈소스 LLM 키미-K2.6 출시…"GPT-5.4·클로드 오퍼스 4.6 능가"

오픈소스LLM거대언어모델멀티모달에이전트벤치마크MoE어텐션메커니즘

미라 무리타 싱킹 머신즈 CEO, 다른 LLM들과 차별화를 말하다

2026. 6. 8. 오후 2:21

미라 무리타 싱킹 머신즈 CEO, 다른 LLM들과 차별화를 말하다

LLM음성인식멀티모달인간중심AI협력AI대화모델AI스타트업자율성

K-AI, 국가유산 체험부터 차량용 에이전트, 금융까지 활용된다

2026. 6. 8. 오전 10:18

K-AI, 국가유산 체험부터 차량용 에이전트, 금융까지 활용된다

K-AINPULLM음성AI디지털트윈이미지생성에이전트금융AI

서울대 찾은 젠슨 황 "K만 붙이면 유명해진다…나는 K-젠슨"

연합인포맥스

2026. 6. 8. 오후 1:01

서울대 찾은 젠슨 황 "K만 붙이면 유명해진다…나는 K-젠슨"

AI엔비디아칩설계LLM오픈소스로봇에이전트신약개발

[PIS FAIR 2026 미리보기] AI가 묻고 스스로 막는다... 안랩 ‘AhnLab AI PLUS’

2026. 6. 8. 오전 10:04

[PIS FAIR 2026 미리보기] AI가 묻고 스스로 막는다... 안랩 ‘AhnLab AI PLUS’

AI보안LLM위협탐지XDR에이전트보안거버넌스데이터유출인텔리전스

"음성기록·요약 3분이면 끝"…대학생·직장인 홀린 AI필기앱

2026. 6. 7. 오전 11:11

"음성기록·요약 3분이면 끝"…대학생·직장인 홀린 AI필기앱

음성인식AI필기LLM음성변환멀티모달음성처리B2B해외진출