AMD 亮剑!Instinct MI450 机架级 AI 集群挑战英伟达霸权
在 AI 算力竞赛中,英伟达(NVIDIA)长期占据主导地位,其 Blackwell 架构的 GB200/GB300 集群已成为行业标杆。然而,AMD 正酝酿一场反击——据 SemiAnalysis 最新爆料,AMD 计划在 2026 年下半年 推出 Instinct MI450 IF128,这将是该公司首个 机架级 AI 计算集群,目标直指英伟达的 Vera Rubin VR200 NVL144 架构。
AMD 的杀手锏:Infinity Fabric over Ethernet,单 GPU 带宽超 1.8TB/s
AMD 的 MI450 机架方案将采用 以太网上的 Infinity Fabric(IFoE) 作为互连技术,使其在 GPU 间通信带宽上实现重大突破:
- 128-GPU 集群 提供 单向 1.8TB/s 的超高带宽,远超传统 NVLink 方案。
- 每个 GPU 配备 3 个 Pensando 800GbE 网卡,总网络带宽高达 2.4Tbit/s,比英伟达 VR200 NVL144 高出 1.5 倍。
- 另提供 64-GPU 精简版(MI450 IF64),优化成本与部署灵活性。
这一设计理论上可挑战英伟达的 Vera Rubin 和 Blackwell Ultra GB300,但 AMD 仍需面对 量产难度 和 市场接受度 的考验。
英伟达仍占先机,AMD 能否后来居上?
尽管 AMD 的 MI450 在纸面参数上颇具竞争力,但英伟达已凭借 成熟的 CUDA 生态 和 Blackwell 架构的液冷 GB300 牢牢占据市场。关键挑战包括: - 量产难题:MI450 IF128 的复杂设计可能导致良率问题,初期供应受限。
- 软件生态劣势:ROCm 仍落后于 CUDA,开发者支持是关键。
- 客户惯性:大型云厂商(如 AWS、Azure)已深度绑定英伟达,转换成本高。
AI 推理市场:AMD 的另一个突破口?
AMD CEO 苏姿丰曾强调,边缘 AI 推理(如手机、笔记本)是未来增长点,而 MI400 系列可能通过 能效优势 在该领域抢占份额。若 MI450 能在 机架级训练 和 推理优化 上双线突破,AMD 或真正动摇英伟达的统治地位。
行业观察:
英伟达 Blackwell Ultra GB300 预计 2025 年中上市,采用 全液冷设计,性能再提升。
AMD 若想逆袭,需在 2026 年交付稳定量产 并争取头部客户(如 Meta、微软)支持。