IT뉴스모아news terminal

article detail

AI 추론칩 부상에 엔비디아 독주 흔들리나

글로벌이코노믹AI인프라AI추론칩GPU그록블랙웰엔비디아추론특화토큰비용
2026. 4. 26. 오전 5:00
AI 추론칩 부상에 엔비디아 독주 흔들리나

AI 요약

네비우스 관계자는 그록(Groq)의 AI 추론용 칩이 특정 조건에서 엔비디아 최신 블랙웰 계열 GPU보다 비용 측면에서 최대 5배 저렴하고 처리 속도는 약 2배 빠를 수 있으며, 그록 칩은 초당 최대 800토큰을 처리하는 반면 엔비디아 칩은 약 450토큰 수준이라고 설명했습니다. 네비우스는 AI 인프라가 시간당 GPU 사용료 중심에서 토큰당 비용 기준으로 빠르게 전환되고 있고, 온디맨드 기준 엔비디아 H100은 시간당 약 2.95달러, H200은 3.50달러, B200은 4.90~6.50달러인 반면 그록은 100만 토큰당 0.05~0.10달러, 엔비디아는 약 0.25달러 수준이라고 밝혔습니다. 다만 이 비교는 특정 추론 작업 기준이며 엔비디아 GPU는 대규모 모델 학습과 다양한 워크로드를 처리하는 범용성이 있고 그록은 추론 특화라는 점과 기업용 AI 작업의 90~95%가 추론 단계에서 발생한다는 배경이 제시되었습니다.

원문보기
feed://articles/related관련 기사
"팹도 AI가 돌린다"...SK하이닉스, 블랙웰 GPU 2000장 도입디일렉
2026. 4. 23. 오후 2:47

"팹도 AI가 돌린다"...SK하이닉스, 블랙웰 GPU 2000장 도입

AI인프라GPU디지털트윈공정자동화반도체팹엔비디아AI에이전트클라우드
오픈AI, 노르웨이 ‘스타게이트’도 물러서나…MS가 230MW 데이터센터 품었다mstoday.co.kr
2026. 4. 16. 오후 5:43

오픈AI, 노르웨이 ‘스타게이트’도 물러서나…MS가 230MW 데이터센터 품었다

AI인프라데이터센터GPU클라우드마이크로소프트오픈AI엔비디아IPO
오픈AI, 노르웨이 '스타게이트' 데이터센터도 포기…MS가 접수v.daum.net
2026. 4. 16. 오전 2:27

오픈AI, 노르웨이 '스타게이트' 데이터센터도 포기…MS가 접수

데이터센터GPU클라우드컴퓨팅AI인프라비용최적화IPO엔비디아마이크로소프트
카카오엔터프라이즈, ‘엔비디아 B200’ 40장 적기 입고…전남 AI 전환 ‘속도’디지털데일리
2026. 4. 14. 오후 2:09

카카오엔터프라이즈, ‘엔비디아 B200’ 40장 적기 입고…전남 AI 전환 ‘속도’

GPUAI인프라블랙웰지역정책AI솔루션에너지관리제조업바이오산업
카카오엔터프라이즈, 전남 ‘AI 사업' 위한 GPU ‘B200’ 적기 확보브릿지경제
2026. 4. 14. 오전 11:17

카카오엔터프라이즈, 전남 ‘AI 사업' 위한 GPU ‘B200’ 적기 확보

AIGPU인프라엔비디아블랙웰중소기업플랫폼솔루션
"엔비디아만 고집하면 도태"… 빅테크, AI 칩 생태계 '가성비'로 전면 재편글로벌이코노믹
2026. 4. 26. 오전 3:25

"엔비디아만 고집하면 도태"… 빅테크, AI 칩 생태계 '가성비'로 전면 재편

AI칩추론가성비엔비디아GPUHBMCPU비용효율
AI 추론 시대, CPU 앞세운 인텔 '제2의 엔비디아' 되나파이낸셜뉴스
2026. 4. 26. 오전 2:30

AI 추론 시대, CPU 앞세운 인텔 '제2의 엔비디아' 되나

AI추론CPUGPU엔비디아파운드리신공정주가급등AI시대
[빅테크칼럼] ‘AI 시대’ 선언한 엔비디아, GPT‑5.5 코덱스를 직원 1만명에게 이식한다뉴스스페이스
2026. 4. 25. 오전 11:08

[빅테크칼럼] ‘AI 시대’ 선언한 엔비디아, GPT‑5.5 코덱스를 직원 1만명에게 이식한다

AI모델코딩도구생산성GPU추론최적화엔비디아오픈AI대규모투자
15개월 침묵의 딥시크…엔비디아는 떨고 있다?(feat. 화웨이)[딥다이브]v.daum.net
2026. 4. 25. 오전 10:02

15개월 침묵의 딥시크…엔비디아는 떨고 있다?(feat. 화웨이)[딥다이브]

추론모델딥시크GPU화웨이칩엔비디아스톡옵션인재이탈칩공급
메타, ‘에이전틱 AI’ 인프라에 CPU 대규모 확장… AWS, 수천만 개 '그라비톤 칩' 도입인공지능신문
2026. 4. 25. 오전 8:25

메타, ‘에이전틱 AI’ 인프라에 CPU 대규모 확장… AWS, 수천만 개 '그라비톤 칩' 도입

AI인프라CPU칩그라비톤에이전트AI데이터센터GPU맞춤형칩클라우드협력
딥시크, 1년 만에 새 모델 ‘V4’ 공개…엔비디아 의존도 낮추나한겨레
2026. 4. 24. 오후 6:53

딥시크, 1년 만에 새 모델 ‘V4’ 공개…엔비디아 의존도 낮추나

인공지능대언어모델오픈소스엔비디아중국기업GPU칩반도체자금조달
"싼 GPU의 저주"… AI 전쟁 승패, '시간당 요금'이 아닌 '굿풋'이 가른다글로벌이코노믹
2026. 4. 23. 오전 4:55

"싼 GPU의 저주"… AI 전쟁 승패, '시간당 요금'이 아닌 '굿풋'이 가른다

GPUAI연산총소유비용굿풋엔비디아클라우드데이터센터운영소프트웨어