IT뉴스모아news terminal

article detail

"코딩은 29배, 추론은 7배"…세레브라스, '키미' 서비스로 GPU 압도

AI타임스AI칩LLM가중치양자화엔터프라이즈웨이퍼스케일추론성능클라우드서비스토큰처리

2026. 5. 25. 오후 5:18

"코딩은 29배, 추론은 7배"…세레브라스, '키미' 서비스로 GPU 압도

AI 요약

AI 칩 전문 세레브라스가 문샷 AI의 1조 매개변수 오픈웨이트 모델 키미 K2.6을 기업 고객 대상으로 서비스하기 시작했으며, 기업 고객 시험 운영에서 아티피셜 애널리시스 기준 초당 981개 출력 토큰을 기록해 GPU 기반 클라우드 서비스 중 가장 빠른 경쟁사보다 6.7배, 업계 평균 대비 23배 빠른 성능을 보였다고 밝혔습니다. 에이전트 코딩 작업에서는 세레브라스 시스템이 1만개 입력 토큰과 500개 출력 토큰의 복합 요청을 5.6초에 처리한 반면 키미 공식 엔드포인트는 같은 작업에 163.7초가 소요돼 응답 속도가 약 29배 빠르다고 소개했습니다. 회사는 이 같은 경쟁력이 WSE 3 웨이퍼스케일 엔진 기반의 단일 칩 구조와 대용량 SRAM 집적, 20대 규모 CS-3 클러스터에서의 4비트 가중치·16비트 연산, 칩 내부 네트워크 대역폭이 엔비디아 NVL72보다 200배 이상 높다는 점에 기인한다고 설명했으며 서비스는 포춘 500 중심 엔터프라이즈에 우선 제공되고 소프트웨어·금융·헬스케어 주요 기업들이 시험 운영 중이고 지난 14일 상장 직후 주가가 68% 급등했다가 이후 약 17% 조정되었다고 보도했습니다

오픈AI 최신 모델, AWS 베드록서 쓴다… 韓 기업 AI 도입 문턱 낮춰

2026. 6. 2. 오후 1:26

오픈AI 최신 모델, AWS 베드록서 쓴다… 韓 기업 AI 도입 문턱 낮춰

생성형AILLM클라우드서비스AWS코딩에이전트AI도입엔터프라이즈한국기업

알리바바, 에이전틱 시대 위한 AI 풀스택 업그레이드...최신 모델 '큐웬3.7-Max', 'AI 칩' 등 공개

인공지능신문

2026. 5. 21. 오후 12:37

알리바바, 에이전틱 시대 위한 AI 풀스택 업그레이드...최신 모델 '큐웬3.7-Max', 'AI 칩' 등 공개

AI풀스택파운데이션모델AI칩에이전트클라우드인프라추론성능LLM소프트웨어스택

[기업탐방] 프로소프트(PROSOFT) - “Low-Code와 산업형 AI의 융합”

재개발재건축매거진

2026. 6. 6. 오후 9:12

[기업탐방] 프로소프트(PROSOFT) - “Low-Code와 산업형 AI의 융합”

로우코드산업용AI디지털전환엔터프라이즈물류솔루션LLM워크플로우온프레미스

오픈AI·앤트로픽 이어 메타도 AI B2B 승부수

2026. 6. 6. 오전 7:12

오픈AI·앤트로픽 이어 메타도 AI B2B 승부수

AI에이전트B2B시장엔터프라이즈LLM메시징플랫폼수익화중소기업자동화

갈라서지만 더 닮아가는 MS·오픈AI…AI 패권 놓고 전면 경쟁

2026. 6. 3. 오전 9:33

갈라서지만 더 닮아가는 MS·오픈AI…AI 패권 놓고 전면 경쟁

AI비서에이전트LLM음성기기클라우드비용효율AI칩슈퍼앱

오픈AI GPT-5.5와 코덱스, AWS 아마존 베드록에 정식 출시

2026. 6. 2. 오후 3:02

오픈AI GPT-5.5와 코덱스, AWS 아마존 베드록에 정식 출시

생성형AILLM클라우드API코딩엔터프라이즈보안추론

AWS 베드록서 오픈AI 모델 쓴다…GPT-5.5·코덱스 등 정식 출시

아시아경제

2026. 6. 2. 오후 12:42

AWS 베드록서 오픈AI 모델 쓴다…GPT-5.5·코덱스 등 정식 출시

클라우드생성형AILLM코딩에이전트다국어지원API통합엔터프라이즈

오픈AI, GPT-5.5·코덱스 AWS 베드록에 정식 출시

디지털데일리

2026. 6. 2. 오전 10:38

오픈AI, GPT-5.5·코덱스 AWS 베드록에 정식 출시

생성형AILLM코딩에이전트클라우드서비스AWS다국어지원보안암호화자동화

48년 ‘x86’ 아성 흔든 ‘AI 노트북’, AMD 삼키나 [트럼프 스톡커]

2026. 6. 2. 오전 9:19

48년 ‘x86’ 아성 흔든 ‘AI 노트북’, AMD 삼키나 [트럼프 스톡커]

AI칩ARM아키텍처LLM슈퍼칩x86노트북GPU에이전트PC

‘40년 패권’에 흔든다… 엔비디아 AI PC 시장 진출의 의미

더밀크 | The Miilk

2026. 6. 2. 오전 9:13

‘40년 패권’에 흔든다… 엔비디아 AI PC 시장 진출의 의미

AI칩GPUCPU통합프로세서노트북LLM렌더링영상편집

일본도 AI 도입 본격화…후지쯔, 앤트로픽과 맞손

2026. 5. 30. 오후 8:54

일본도 AI 도입 본격화…후지쯔, 앤트로픽과 맞손

생성형AI전략적파트너십일본시장LLM엔터프라이즈AI도입사이버보안디지털혁신

AWS, 리테일 기업용 AI 쇼핑 어시스턴트 출시

데일리시큐

2026. 5. 28. 오후 1:24

AWS, 리테일 기업용 AI 쇼핑 어시스턴트 출시

AI쇼핑생성형AI리테일대화형UI클라우드LLM엔터프라이즈솔루션