article detail
오픈AI, GPU 병목 해결하는 슈퍼컴퓨터 네트워크 규격 'MCR' 공개
2026. 5. 7. 오후 4:26

AI 요약
오픈AI가 AI 모델 학습에 필요한 차세대 슈퍼컴퓨터 네트워크 기술인 ‘MRC’ 사양을 6일(현지시간) 오픈 컴퓨트 프로젝트를 통해 공개하고 AMD, 브로드컴, 인텔, 마이크로소프트, 엔비디아와 공동 개발해 업계가 활용할 수 있도록 개방했습니다. MRC는 초당 800Gb 단일 링크를 여러 개의 초당 100Gb 링크로 분할해 병렬 플레인을 구성하고 수백 개 경로로 분산 전송하는 패킷 스프레이와 SRv6 기반 정적 소스 라우팅을 도입해 약 13만1000개 GPU를 2단계 스위치로 연결하며 혼잡과 장애 복구 시간을 마이크로초 단위로 줄였습니다. 실제 운영에서는 다수의 링크 장애와 스위치 재부팅 발생에도 학습 작업에 측정 가능한 영향이 없었고 텍사스 애빌린의 슈퍼컴퓨터와 마이크로소프트의 ‘페어워터’ 등 엔비디아 'GB200' 기반 클러스터에 이미 적용돼 프론티어 모델 학습에 활용됐습니다.







