IT뉴스모아news terminal

article detail

"코딩은 29배, 추론은 7배"…세레브라스, '키미' 서비스로 GPU 압도

AI타임스AI칩LLM가중치양자화엔터프라이즈웨이퍼스케일추론성능클라우드서비스토큰처리
2026. 5. 25. 오후 5:18
"코딩은 29배, 추론은 7배"…세레브라스, '키미' 서비스로 GPU 압도

AI 요약

AI 칩 전문 세레브라스가 문샷 AI의 1조 매개변수 오픈웨이트 모델 키미 K2.6을 기업 고객 대상으로 서비스하기 시작했으며, 기업 고객 시험 운영에서 아티피셜 애널리시스 기준 초당 981개 출력 토큰을 기록해 GPU 기반 클라우드 서비스 중 가장 빠른 경쟁사보다 6.7배, 업계 평균 대비 23배 빠른 성능을 보였다고 밝혔습니다. 에이전트 코딩 작업에서는 세레브라스 시스템이 1만개 입력 토큰과 500개 출력 토큰의 복합 요청을 5.6초에 처리한 반면 키미 공식 엔드포인트는 같은 작업에 163.7초가 소요돼 응답 속도가 약 29배 빠르다고 소개했습니다. 회사는 이 같은 경쟁력이 WSE 3 웨이퍼스케일 엔진 기반의 단일 칩 구조와 대용량 SRAM 집적, 20대 규모 CS-3 클러스터에서의 4비트 가중치·16비트 연산, 칩 내부 네트워크 대역폭이 엔비디아 NVL72보다 200배 이상 높다는 점에 기인한다고 설명했으며 서비스는 포춘 500 중심 엔터프라이즈에 우선 제공되고 소프트웨어·금융·헬스케어 주요 기업들이 시험 운영 중이고 지난 14일 상장 직후 주가가 68% 급등했다가 이후 약 17% 조정되었다고 보도했습니다

원문보기
feed://articles/related관련 기사
알리바바, 에이전틱 시대 위한 AI 풀스택 업그레이드...최신 모델 '큐웬3.7-Max', 'AI 칩' 등 공개인공지능신문
2026. 5. 21. 오후 12:37

알리바바, 에이전틱 시대 위한 AI 풀스택 업그레이드...최신 모델 '큐웬3.7-Max', 'AI 칩' 등 공개

AI풀스택파운데이션모델AI칩에이전트클라우드인프라추론성능LLM소프트웨어스택
AI 모델 통합 라우팅 ‘오픈라우터’, 시리즈B 1억1,300만 달러 투자 유치와우테일
2026. 5. 27. 오전 8:26

AI 모델 통합 라우팅 ‘오픈라우터’, 시리즈B 1억1,300만 달러 투자 유치

AI모델API통합라우팅플랫폼시리즈B벤처투자개발자도구토큰처리엔터프라이즈
"오픈AI 911조 자본전쟁" 삼성·SK 하이닉스 운명 바꿀 '3가지 숫자'글로벌이코노믹
2026. 5. 24. 오전 3:35

"오픈AI 911조 자본전쟁" 삼성·SK 하이닉스 운명 바꿀 '3가지 숫자'

AI칩IPOLLMHBMGPU데이터센터반도체ASIC
LLM 효율화 경쟁 속 비드래프트, AI 프레임워크 기술 공개한경매거진&북
2026. 5. 22. 오후 2:52

LLM 효율화 경쟁 속 비드래프트, AI 프레임워크 기술 공개

LLM추론성능모델병합프레임워크AI스타트업파라미터융합특허출원성능평가
LLM 효율화 경쟁 속 비드래프트, AI 프레임워크 기술 공개한경매거진&북
2026. 5. 22. 오후 2:52

LLM 효율화 경쟁 속 비드래프트, AI 프레임워크 기술 공개

LLM추론성능모델병합AI프레임워크연산효율파라미터융합스타트업기술논문
비드래프트 LLM ‘다윈 패밀리’, GPU 학습 없이 세계 3위 기록데이터넷
2026. 5. 22. 오후 1:36

비드래프트 LLM ‘다윈 패밀리’, GPU 학습 없이 세계 3위 기록

LLM모델병합추론성능GPU학습다윈패밀리특허출원양자화오픈소스
클로드 수요 급증에 컴퓨팅 확보전···앤트로픽, MS AI칩 활용 추진서울파이낸스
2026. 5. 22. 오전 10:25

클로드 수요 급증에 컴퓨팅 확보전···앤트로픽, MS AI칩 활용 추진

AI칩추론데이터센터인프라확보서버임대토큰처리TSMC공정HBM
"LLM만 붙이면 끝? 기업 AI 에이전트의 핵심은 '워크플로우'"… 최규호 오브젠 DX팀 이사브랜드브리프
2026. 5. 22. 오전 7:00

"LLM만 붙이면 끝? 기업 AI 에이전트의 핵심은 '워크플로우'"… 최규호 오브젠 DX팀 이사

AI에이전트워크플로우LLM노코드데이터처리자동화엔터프라이즈
알리바바, AI 풀스택 업그레이드 발표…신규 LLM·AI칩·인프라 공개플래텀(Platum)
2026. 5. 21. 오후 1:57

알리바바, AI 풀스택 업그레이드 발표…신규 LLM·AI칩·인프라 공개

LLMAI칩클라우드파운데이션모델에이전트AI인프라모델서비스안전거버넌스
“엔비디아 없이도 간다” AI 풀스택 갖춰가는 알리바바더에이아이
2026. 5. 21. 오후 4:59

“엔비디아 없이도 간다” AI 풀스택 갖춰가는 알리바바

대형언어모델AI가속기클라우드인프라AI칩슈퍼노드자립화에이전트추론성능
베스핀글로벌, 'AWS 서밋 서울 2026'서 AI 운영 전략 소개전자신문
2026. 5. 21. 오전 9:21

베스핀글로벌, 'AWS 서밋 서울 2026'서 AI 운영 전략 소개

AI전환엔터프라이즈LLMRAGAI거버넌스오케스트레이션클라우드AWS
나무기술-레드햇, 에이전틱 AI 플랫폼 개발…고객사 확대v.daum.net
2026. 5. 20. 오후 4:53

나무기술-레드햇, 에이전틱 AI 플랫폼 개발…고객사 확대

AI플랫폼에이전트엔터프라이즈하이브리드온프레미스LLM금융의료