article detail
구글클라우드 "AI 하이퍼컴퓨터, 수백만 에이전트 동시 구동"
2026. 4. 22. 오후 9:03
AI 요약
토마스 쿠리안 구글클라우드 최고경영자는 21일 미국 라스베이거스에서 열린 구글클라우드 넥스트 2026 기자간담회에서 TPU, GPU, CPU, 스토리지, 네트워크를 통합한 AI 하이퍼컴퓨터로 수백만 개의 AI 에이전트를 동시에 구동할 수 있는 컴퓨팅·데이터 환경을 구축했다고 밝혔습니다. 학습용 TPU 8t는 ICI 기반으로 단일 슈퍼포드에서 최대 9600개 TPU와 2PB 메모리까지 확장돼 이전 대비 최대 3배 성능을 제공하고, 추론용 TPU 8i는 온칩 SRAM 확대와 전용 연산 가속 엔진으로 추론 성능을 달러당 최대 80% 개선해 수백만 개 에이전트를 비용 효율적으로 실행하도록 설계됐습니다. 구글은 엔비디아 호퍼·블랙웰과 차세대 베라루빈 NVL72 GPU, 자체 엑시온 CPU, C4N·M4N 인스턴스와 버고 네트워크로 수십만 개 가속기를 연결하며 Managed Lustre 초당 10TB, Rapid Storage 최대 15TB/초, TPU의 파이토치 네이티브 지원과 vLLM 최적화, GKE의 초당 300개 에이전트 샌드박스 배포, MCP 기반 자율 운영 체계 및 에이전틱 데이터 클라우드를 제미나이 모델과 생성형 AI 서비스에 적용해 인프라와 데이터 역량이 AI 경쟁의 핵심이 될 것이라고 발표했습니다.




