«

戴尔携手英伟达,2026年为美能源部打造超级科研“神器”

一把老骨头 发布于 阅读:6 科技新闻


戴尔技术公司成功斩获美国能源部的一份关键合同,将负责建造下一代NERSC - 10超级计算机,而这一超级计算机将基于英伟达薇拉·鲁宾超级计算机架构进行构建。这一项目堪称美国这十年在科学计算基础设施领域最大的联邦投资之一,无疑将为多个前沿研究领域注入强大动力。

此次要建造的超级计算机被命名为“Doudna”,这个名字源自CRISPR基因编辑技术的先驱詹妮弗·杜德纳。它不仅仅是一台冰冷的机器,更是人工智能、量子工作流以及来自实验设施实时数据流的完美集成体。与传统超级计算机主要聚焦于计算吞吐量不同,Doudna的架构独具匠心,着重强调CPU和GPU之间的一致内存访问,能够支持异构处理器中的数据共享,这一特性完美契合了现代人工智能加速的科学工作流需求。

英伟达薇拉·鲁宾超级计算机平台更是引入了诸多硬件级优化,这些优化专门为模拟、机器学习和量子算法开发的融合而设计。在当今这个科技飞速发展的时代,这些领域正日益成为前沿研究的核心驱动力。能源部长克里斯·赖特在5月29日访问伯克利实验室期间正式宣布了这一合同,并将2026年的部署计划视为保持美国技术领先地位的必要基础设施。这一时间节点与全球范围内人工智能和量子计算领域不断升级的竞争态势高度契合,毕竟在当今科研领域,计算能力在很大程度上决定着研究的速度和突破的潜力。

技术实力与卓越指标
Doudna系统绝非对现有基础设施的简单升级,而是一次质的飞跃。根据NERSC的规范,它将实现科学输出10倍于其前身Perlmutter的惊人成就,而功耗却仅为其2 - 3倍。通过芯片设计和系统级效率的优化,每瓦性能更是提高了3 - 5倍。NERSC高级技术小组负责人兼Doudna首席架构师尼克·赖特自信地表示:“我们不仅仅是在建造一台更快的计算机,更是在搭建一个系统,助力研究人员拓展思维边界,加速发现进程。”

英伟达薇拉·鲁宾超级计算机架构将高性能CPU与连贯GPU完美集成,实现了所有处理器中的直接数据访问和共享。这种一致内存模型有效解决了科学计算工作流中的传统瓶颈,尤其是那些需要在不同处理单元之间快速移动数据的工作流。戴尔技术公司则凭借其专业的系统集成能力,利用英伟达的平台,为从传统高性能计算到人工智能应用以及量子算法开发等各种工作负载提供有力支持。

科研应用与深远影响
Doudna系统将服务于能源部科学任务领域的大约11,000名研究人员,其目标直指多个目前受计算能力限制而进展缓慢的研究领域。在聚变能源研究方面,该系统将具备模拟聚变动力的强大能力。DIII - D国家聚变设施将控制室数据直接传输到Doudna,用于实时等离子体建模,使科学家能够在实验过程中迅速做出调整,大大提高研究效率。

材料科学领域也将迎来新的变革。人工智能驱动的超导材料设计将成为可能,有望将发现时间从数年大幅缩短至数月。同时,该系统还将支持“开放分子2025”项目,这是伯克利实验室和Meta之间的一项重要合作,涉及用于模拟复杂分子化学反应的大规模数据集,为材料科学的发展开辟新的道路。

天文学同样将受益于Doudna系统。Kitt Peak的暗能量光谱仪器将观测数据直接传输到实时宇宙绘图系统,为天文研究人员提供交互式分析,告别以往依赖批处理的繁琐模式。在药物发现领域,快速蛋白质折叠模拟将助力研究人员对新出现的生物威胁做出快速反应。诺贝尔奖获得者大卫·贝克的蛋白质设计工作就是Doudna可以加速研究的典型例证,有望为人类健康事业带来新的突破。

战略意义与国家优先
这一项目的宣布恰逢全球对技术领先地位的竞争日益激烈之际,特别是在人工智能和量子计算领域。赖特部长将这项投资视为保持美国科学领先地位的关键,称人工智能为“我们时代的曼哈顿工程”。他强调:“Doudna系统代表了DOE对推进美国在科学、人工智能和高性能计算领域领导地位的坚定承诺。它将成为快速创新的动力源泉,不仅将改变我们开发丰富、负担得起的能源供应的努力,还将推动量子计算取得重大突破。”该系统的能力跨越了传统科学计算和新兴人工智能应用,充分体现了人们对未来突破将越来越依赖混合方法的深刻认识。

行业协作与技术融合
此次合作凸显了联邦研究机构与私营技术公司之间紧密的合作关系。戴尔凭借其系统集成专业知识,英伟达则提供专业的硬件平台,双方携手共进。英伟达首席执行官黄仁勋将Doudna形容为“科学的时间机器——将数年的发现压缩到几天内”,这一宣传性言辞背后,是对加快研究进度的真实期望。这种合作不仅仅局限于硬件供应,还涵盖了软件优化和工作流程集成。目前,超过20个研究团队正在通过NERSC科学加速计划将应用移植到新架构,为系统的顺利运行奠定坚实基础。

技术整合与网络连接
Doudna系统的有效性在很大程度上取决于其与现有研究基础设施的整合程度。能源科学网络(ESnet)将为来自望远镜、探测器和基因组测序仪的实时数据流提供与全国实验设施的高通量、低延迟连接。Nvidia Quantum - X800 InfiniBand网络可用于此类数据流,其服务质量机制可有效提高性能。网络架构实现了从传统批处理到交互式实时科学计算的转变,正如赖特所解释的:“我们过去认为超级计算机是角落里的被动参与者,现在它已成为整个工作流程的一部分,与实验、望远镜和探测器紧密相连。”

关键评估与潜在挑战
尽管Doudna系统的技术规格令人瞩目,但仍有几个关键因素将决定其对科学发现的实际影响。10倍性能提升的说法取决于具体的工作负载特征,可能并不适用于所有研究应用。虽然能效提高显著,但对于单个系统而言,这仍然意味着巨大的能耗。Perlmutter上2 - 3倍的功率增加表明总消耗可能达到几十兆瓦,这不禁让人对长期运营成本和环境影响产生担忧。

软件生态系统的成熟度也是一个不容忽视的挑战。虽然PyTorch、TensorFlow和Nvidia的专业库等框架正在针对Rubin架构进行优化,但要充分发挥系统功能,还需要大量的应用移植和优化工作。此外,2026年的部署时间表也带来了一定的不确定性,因为硬件和软件组件必须同时成熟,任何一个方面的延迟都可能影响系统对时间敏感的研究应用的有效性。

nvidia 超级计算机 DELL Doudna