Nvidia推出革命性Dynamo技术,可助DeepSeek加速30倍
在2025年3月18日,Nvidia在其GTC大会上宣布了一项重大进展,旨在通过其最新的Dynamo软件使DeepSeek的AI处理速度提升至原来的30倍。这一举措是为了解决投资者对于DeepSeek减少计算需求可能带来的经济效益担忧。
Nvidia联合创始人兼CEO黄仁勋介绍了如何利用公司的Blackwell芯片显著加速DeepSeek R1的处理能力。Dynamo软件,现在已在GitHub上开放源代码,能够将推理任务分布在多达1000个Nvidia GPU之间运行,从而大幅提升每秒处理的令牌数量。据Nvidia的超大规模和高性能计算负责人Ian Buck介绍,使用Dynamo可以在相同架构和GPU数量下实现30倍的性能提升。
这项技术不仅提高了服务提供者每秒处理令牌的数量,从而增加了收入,还允许他们根据客户需求调整服务质量。例如,提供更高级别的服务给愿意支付更多费用的用户。Buck指出,这使得“AI工厂”可以提供更高价值的服务,并增加整个工厂的总令牌量。
此外,Nvidia还发布了Blackwell系列的新成员——Ultra版本,进一步增强了原有的Blackwell 200型号,如将HBM3e高带宽内存从192GB扩展到288GB。结合Grace CPU,最多72个Blackwell Ultras可以集成在一个NVL72机架式计算机中,相较于基于Grace-Blackwell 200芯片的系统,在FP4精度下的推理性能提升了50%。
其他重要发布包括了Project Digits的正式命名DGX Spark、新一代DGX Station桌面电脑以及与多家公司合作的Omniverse软件更新等。值得一提的是,Nvidia Isaac GROOT N1模型专为类人机器人设计,预训练以实现快速和慢速思考模式。