«

外媒:DeepSeek研究揭示,华为昇腾910C推理性能突破,达英伟达H100的60%

一把老骨头 发布于 阅读:362 科技新闻


尽管华为的Ascend 910C在性能上尚未达到顶尖水平,但它可能成为中国减少对英伟达GPU依赖的关键一步。

华为的Ascend 910C是其2019年推出的Ascend 910 AI训练处理器的升级版本。虽然Ascend 910在大型AI模型训练方面的表现勉强满足成本效益要求,但根据DeepSeek的最新研究,Ascend 910C在推理任务中的性能已达到英伟达H100的60%。尽管这一成绩并不足以使其成为性能冠军,但它为中国提供了一个可行的替代方案,以减少对英伟达GPU的依赖。

DeepSeek的测试结果显示,Ascend 910C在推理性能方面超出了预期。通过手动优化CUNN内核,其效率还可以进一步提升。此外,DeepSeek对Ascend处理器的原生支持及其PyTorch存储库的兼容性,使得从CUDA到CUNN的转换变得无缝衔接,从而简化了华为硬件在AI工作流中的集成。

这一进展表明,尽管受到美国制裁且无法使用台积电的先进制程技术,华为的AI处理器能力仍在快速提升。华为和中芯国际(SMIC)已经成功在2019-2020年间追平台积电的技术水平,并生产出能与英伟达A100和H100竞争的芯片。然而,Ascend 910C在AI训练方面仍显不足,而训练领域正是英伟达保持其领先地位的关键。

DeepSeek的研究员金于宸指出,长期训练的可靠性是中国处理器的短板之一。这一问题的根源在于英伟达硬件与软件生态系统的深度集成,这一生态系统已经发展了二十多年。尽管推理性能可以通过优化提升,但持续的训练工作负载仍需华为在硬件和软件堆栈上进一步改进。

Ascend 910C采用了小芯片封装设计,主计算SoC集成了约530亿个晶体管。初代Ascend 910的计算小芯片由台积电采用N7+(EUV 7纳米级)工艺制造,而Ascend 910C的计算小芯片则由中芯国际使用其第二代7纳米级工艺(N+2)生产。

展望未来,一些专家预测,随着AI模型逐渐向变压器架构靠拢,英伟达软件生态系统的重要性可能会减弱。DeepSeek在硬件和软件优化方面的专业能力,也有望显著降低对英伟达的依赖,为AI公司提供更具成本效益的替代方案,尤其是在推理任务中。然而,若要在全球范围内与英伟达竞争,中国仍需解决训练稳定性的问题,并进一步完善其AI计算基础设施。

华为 deepseek 910