article detail
구글, AI 칩 역대 처음으로 두 개로 쪼갰다…8세대 TPU ‘TPU 8t·8i’ 공개
2026. 4. 24. 오전 5:14

AI 요약
구글은 22일 라스베이거스에서 열린 Google Cloud Next ’26에서 8세대 TPU인 TPU 8t와 TPU 8i를 공개했으며, 역대 TPU 가운데 처음으로 학습(training)과 추론(inference)을 각각 담당하는 두 가지 아키텍처로 나눴다고 밝혔습니다. TPU 8t는 대규모 모델 학습에 특화되어 단일 슈퍼파드에 9,600개의 TPU를 집적해 121 엑사플롭스 연산력과 2PB 공유 메모리를 제공하고 아이언우드 대비 처리 성능은 약 3배, 와트당 성능은 최대 2배 향상되어 구글은 100만 개 이상의 TPU를 단일 클러스터로 묶어 학습 시간을 몇 달에서 몇 주로 단축할 수 있다고 설명했습니다. TPU 8i는 추론에 최적화된 칩으로 온칩 SRAM을 384MB로 늘리고 HBM을 288GB로 확장했으며 ICI 대역폭을 19.2Tb/s로 늘리고 보드플라이 토폴로지와 CAE 도입으로 단일 파드에 1,152개 TPU를 직접 연결해 추론 달러당 성능을 80% 향상시켰고, 버고 네트워크와 관리형 루스터 등을 통해 데이터센터와 멀티사이트 규모에서의 확장을 지원하며 TPU 8t·8i는 올해 안에 구글 클라우드 고객에게 제공될 예정입니다.


![TPU 전면전부터 넷플릭스의 '줍줍'까지… AI 인프라 재편하는 빅테크 [美증시 특징주]](https://img.wowtv.co.kr/nrcs/production/images/20260423/20260423_bd1538ad5d56438aadd7c46b495a3052.png)




