article detail
구글, 차세대 AI 학습·추론용 TPU 2종 공개
2026. 4. 22. 오후 10:25

AI 요약
22일(현지시간) 실리콘앵글에 따르면 구글은 구글 클라우드 넥스트 2026에서 차세대 AI 워크로드용 텐서처리장치 TPU 8t와 TPU 8i를 공개했습니다. TPU 8t는 대규모 사전학습과 임베딩 중심 작업에 최적화돼 3D 토러스 네트워크로 단일 포드에서 9600개 칩을 연결할 수 있고 불규칙한 메모리 접근을 처리하는 전용 가속기 스파스코어와 4비트 부동소수점 연산을 지원해 처리량을 2배로 늘리며 대규모 학습에서 아이언우드보다 달러당 성능이 최대 2.7배 개선된다고 구글은 설명했습니다. TPU 8i는 추론에 초점을 맞춰 고대역폭 메모리와 전용 네트워크로 사후 학습과 고동시성 추론을 지원하고 정적 램 용량을 아이언우드보다 3배 늘려 키-값 캐시와 텍스트 생성 속도를 개선하며 두 칩 모두 이전 세대보다 와트당 성능이 2배 높고 TPU 8i는 낮은 지연에서 달러당 성능을 약 80% 개선하는 것을 목표로 한다고 구글은 덧붙였습니다.





