这份文件是关于Nvidia在GTC(GPU技术大会)上宣布的Blackwell架构及其不同配置的详细介绍。文件由Dylan Patel和Daniel Nishball撰写,日期为2024年3月25日。 主要内容包括: 1. **Blackwell架构的介绍**:Nvidia宣布了8种以上的不同SKUs(库存单位)和配置,包括内存、CUDA核心数量等芯片级别的差异,以及系统级别的差异,如形态因素、网络、CPU和功耗等。 2. **DGX GB200 NVL72的亮点**:Nvidia重点介绍了其垂直集成的DGX GB200 NVL72,这是一个集成的机架,包含72个GPU、36个CPU、18个NVSwitches、72个InfiniBand网络接口卡(NICs)用于后端网络,以及36个Bluefield 3以太网NICs用于前端网络。 3. **NVLink 5技术**:Nvidia的DGX GB200 NVL72能够通过900GB/s的NVLink 5连接在同一机架内连接72个GPU,这引起了市场上对光学元件供应商的担忧,因为NVLink网络通过5184根直接驱动铜缆连接所有72个GPU,而不是使用光学元件。 4. **光学元件的需求误解**:市场上的一些观察者错误地认为,由于NVLink网络连接了机架内所有的72个GPU,因此在集群内实现GPU连接所需的光学元件数量会显著减少。然而,这是不正确的,因为Nvidia的DGX H100和DGX GB200 NVL使用的是三种不同的网络,包括前端网络、后端扩展InfiniBand或以太网网络,以及连接所有GPU的NVLink网络。 5. **真正的光学元件“噩梦”**:文件指出,Nvidia的144端口800G Quantum-X800 Q3400-RA 4U交换机才是真正减少光学元件数量的“噩梦”。这款交换机使用1.6T双端口收发器,通过72个OSFP端口实现总吞吐量为115.2T,即其前代25.6T的Quantum-2 QM9700交换机的四倍。 6. **网络架构和光学元件需求**:文件进一步讨论了使用144端口交换机的网络架构,以及这种架构如何减少所需的交换机数量和光学元件总数。例如,使用144端口交换机的网络可以包含多达10368个GPU节点,而仍保持两层网络拓扑结构,比基于旧的64端口交换机的网络多出近5倍的节点。 7. **光学元件市场的分析**:文件最后提到,尽管从400G到800G的转变以及从800G到1.6T的转变将为某些子组件带来ASP(平均销售价格)的增加,但这是否足以抵消单位数量的下降还有待观察。作者提到将在OFC(光网络和通信会议)上发布的光学模型,其中包含400G、800G和1.6T的ASP、体积估计,以及下游子组件的BOM(物料清单)和市场份额,直至2027年的季度出货量。 这份文件为读者提供了Nvidia最新GPU架构的深入分析,特别是关于其对光学元件市场潜在影响的见解。 |