由产业人士和学术界组成的开放工程联盟(MLCommons)自 2018 年推出 MLPerf 产业基准,是衡量机器学习性能、提高科技透明度的常见指标。随着科技大厂针对 MLPerf Inference 4.1 提出测试资料,尤其 NVIDIA 下一代 Blackwell GPU 首次参与测试,让业界看出各家晶片性能提升至什麽程度。
MLPerf Inference 4.1 测试结果有一系列值得关注的新增内容,像是 MLPerf 首次引进 MoE(Mixture of Experts Models,混合专家模型)性能评估,特别采用开源 Mixtral 8×7B 模型。这一轮基准测试更展示一些令业界关注的晶片和系统,有些还是首次公开测试结果,比方说 AMD MI300X、Google TPU v6e(Trillium)、英特尔 Granite Rapids、Untether AI speedAI 240 等,还有最受市场瞩目的 NVIDIA B200。
虽然 Blackwell GPU 交付到客户手中还需要几个月时间,但 MLPerf Inference 4.1 测试结果可让客户一窥即将到来的强大性能。Blackwell GPU 由於使用 NVIDIA 第二代 Transformer 引擎和 FP4 Tensor 核心,处理 MLPerf 设定的 Llama 2 70B 模型,首次测试结果显示性能较自家 Hopper 架构的 H100 高出 4 倍之多。
而在单一 B200、H200 及竞争对手 MI300X 的比较,MLPerf Inference 4.1 测试结果运用 Llama 2 70B 计算每秒生成 token 数,可看出 B200 的表现遥遥领先 H200 和 MI300X,性能平均达到 H200 约 2.5 倍,更是 MI300X 的 4 倍左右。可见主流的 H200 明显胜过 MI300X,换成下一代 B200 更是大胜。
▲ 比较 AMD MI300X 750W、NVIDIA H200 1kW 和 B200 1kW 的 MLPerf Inference 4.1 测试结果。(Source:ServeTheHome)
值得关注的是,MI300X 规格如电晶体、HBM 等比起 H200 复杂,封装复杂度更高,可推测 AMD 这款 AI 晶片成本高昂,却要卖得更便宜才能与 NVIDIA 竞争。信昕产研从这一轮 MLPerf 测试结果分析,MI300X 合理价格可能要比目前 H200 低约 30%。
换个角度来看,市场可能对於 NVIDIA 产品毛利高有些意见,一旦性能强大的 NVIDIA GPU 价格再低一点,恐无对手与之竞争。
- MLPerf Inference 4.1 results show gains as Nvidia Blackwell makes its testing debut
- AMD posts first Instinct MI300X MLPerf benchmark results — roughly in line with Nvidia H100 performance
- MLPerf Inference 4.1 NVIDIA B200 Wallops AMD MI300X UntetherAI Rises
(首图来源:NVIDIA)