联想:CIO们遭受人工智能与虚拟化双重压力,存储进化能否破局?
在当今数字化浪潮汹涌澎湃的时代,首席信息官(CIO)们正站在科技变革的风口浪尖,面临着前所未有的挑战。其中,人工智能和虚拟化这两大难题,如同两座大山,压得他们喘不过气来。而存储,作为企业信息技术架构的核心基石,能否在这场风暴中成为破局的关键力量呢?联想给出了独特的见解:这是关于进化而非革命。
人工智能,无疑是当下科技领域最耀眼的明星,它正以摧枯拉朽之势改变着技术行业,并间接地影响着其他所有行业。人工智能的蓬勃发展依赖于海量的数据,这就使得存储在企业保持竞争力方面扮演着举足轻重的角色。根据联想的CIO Playbook报告,数据质量问题已然成为AI项目达到预期的主要障碍。想象一下,如果存储的数据质量参差不齐,就像建造高楼大厦时使用了劣质的砖块,那么再先进的人工智能算法也难以发挥出应有的威力。
然而,这仅仅是冰山一角。CIO们还面临着诸多其他挑战,其中由博通在2023年底收购VMware以及随后对其许可和定价政策进行更改所引发的虚拟化策略动荡,无疑是最为棘手的问题之一。这一变动让CIO们陷入了艰难的抉择之中。
联想数据存储解决方案事业部执行总监兼总经理斯图尔特·麦克雷指出,此时CIO们主要有三个选择。第一个选择是适应变化并继续使用VMware,尽可能优化他们的系统,以确保从这些更昂贵的许可证中获得最大价值。但这就像是在一条崎岖的山路上艰难前行,每一步都需要小心翼翼,稍有不慎就可能付出高昂的代价。
另一种选择是寻找替代平台来处理至少部分虚拟化工作负载。这看似是一条充满希望的出路,但实际上却充满了挑战。新的平台可能存在兼容性问题,员工需要重新学习操作技能,而且整合过程中也可能会出现各种意想不到的故障。
或者他们可以完全放弃VMware。但这将意味着彻底改造他们的基础设施,要么支持新的平台,要么从他们的遗留系统中获得最大的收益。这无疑是一场伤筋动骨的大手术,需要投入大量的时间、精力和资金。
人工智能和虚拟化就像两个无形的巨手,迫使技术领导者对其存储策略进行长时间、深入的审视。而且,麦克雷强调,这些挑战并不是孤立的,而是密切相关的。
正如联想的首席信息官手册所明确的,技术领导者们不仅仅是在寻求尝试人工智能或开始部署这项技术。他们面临着巨大的压力,要在客户体验、业务增长、生产力和效率等领域产生商业成果。同时,他们也在寻找使决策数据驱动的方法。这就意味着他们的核心遗留平台,如SAP、甲骨文和内部应用程序将发挥重要作用,因为企业数据就存放在那里。
麦克雷说:“他们仍然拥有这些系统,人工智能将嵌入到许多这样的系统中,他们将希望利用这些数据来支持他们在RAG模型中的努力。”这就像是在一座古老的城堡中引入新的科技元素,既要保留城堡的原有风貌,又要让它具备现代化的功能。
存储,已然成为一个现实世界的问题。这些系统运行在企业虚拟化平台上,因此,为了开发能够带来实际业务价值的AI策略,CIO们也需要确保他们的虚拟化战略同样有序。这意味着存储基础设施需要具备强大的能力,能够为AI和虚拟化提供坚实的支持。
麦克雷明确表示,企业的人工智能和虚拟化存储将绝大多数是在本地或共址的。这些是核心系统,包含关键数据,公司需要对这些系统有直接的控制权。联想的研究显示,不到四分之一的企业在人工智能工作负载的基础设施上采取了“主要”使用公共云的方法。这就像是企业将自己的核心机密交给别人保管,虽然公共云有其便利性,但对于关键数据来说,企业更倾向于掌握在自己手中。
但是,麦克雷也指出了一个令人担忧的问题:“如果你看看客户在过去五年里购买和部署的存储设备,有80%是基于硬盘的存储。”人工智能的挑战,特别是来自他们的存储基础设施方面,是许多存储设备都很旧,它们没有足够的性能和弹性来支持他们在计算GPU方面的AI投资。
从技术角度来看,转向闪存是显而易见的解决方案。在AI应用方面,从性能角度来看的优势是直接的。AI依赖于数据,而在大多数企业中,这些数据将来自现有的应用程序和系统。此外,让GPU在等待数据时闲置是非常浪费的。NVIDIA的高端GPU消耗的能量大约相当于一个家庭一年的能源消耗。这就好比是一辆高性能的跑车,却因为燃料供应不足而无法发挥出其真正的实力。
但这不仅仅是一个性能问题,还带来了更广泛的数据管理问题。麦克雷说:“如果我想比过去更多地使用我的数据,在传统的模型中,他们可能有热、温、冷数据,他们可能希望使这些数据都更加高效。”这甚至扩展到备份和归档。我们看到客户将备份数据转移到闪存中以实现更快的恢复。这就像是对企业的数据进行一场全面的升级改造,让数据能够更加高效地流动和利用。
闪存还提供了其他重要的功率和占地面积优势。在撰写本文时宣布的最高容量硬盘约为36TB,而企业级固态硬盘的范围超过100TB。更重要的是,固态硬盘比它们的机械部件表亲耗电要少得多。鉴于对数据中心整体功耗和冷却需求的担忧,以及许多组织在为其基础设施寻找空间时面临的挑战,这一点变得至关重要。这就像是在有限的土地上建造更加高效、节能的建筑,为企业节省大量的成本和资源。
麦克雷表示,联想的一个关键重点是要实现统一存储,“客户可以在一个平台上统一他们的文件、块和对象数据,并使其性能表现出色。”这对人工智能应用来说有直接的好处,允许企业从他们所有的数据中提取价值。但它也通过消除更多的复杂性而产生了更广泛的管理影响。
“他们没有不同的工具包运行不同的存储解决方案,因此这使他们拥有统一的备份和恢复策略的所有优势,”他说。这就像是将企业的数据管理整合到一个统一的平台上,让管理变得更加简单、高效。
而且,现代基于闪存的系统也提供了弹性优势。麦克雷说,一个现代的20TB硬盘驱动器在发生故障时可能需要五到七天来重建。而一个闪存驱动器可能只需要大约30小时。这就像是在企业面临数据危机时,能够更快地恢复数据,减少损失。
随着人工智能与更广泛、虚拟化的企业环境更加紧密地交织在一起,安全性变得至关重要。正如麦克雷所指出的,尽管在超大规模数据中心中,这些数据中心的底层大型语言模型(LLMs)可能是由小众存储平台开发和训练的,但这不太可能是AI增强型企业计算的情况。当你在企业部署人工智能时,那是你的企业数据,其他应用程序正在使用这些数据。这需要企业的弹性和安全性。
在联想的存储解决方案中,人工智能(AI)在管理存储本身方面扮演着关键角色。例如,除了像不可变副本和快照这样的功能外,“拥有能够提供自主、由AI驱动的勒索软件保护的存储来检测任何异常或正在发生不良事件的数据对于这些数据来说非常重要。”这就像是为企业的数据配备了一位忠诚的卫士,时刻守护着数据的安全。
然而,技术领导者们也面临着一些困惑:他们到底需要多少存储空间呢?这就是联想管理服务产品及其TruScale策略发挥作用的地方。它们允许以运营支出(OpEx)和基于消费的方式采购存储和其他基础设施,并且随着时间的推移解锁并扩展或缩减容量。
麦克雷说:“每个企业的资本模型和结构都不同。但是消费模式对于不确定的应用和部署推广来说效果很好。”毕竟,大多数客户刚刚开始推出新的虚拟化和人工智能工作负载。McRae说:“我们通常在开始部署时学习东西。它可能不会完全像我们计划的那样运作。这种灵活性和扩展性能与容量的能力真的很重要。”
同样重要的是能够调用了解技术和个别企业具体情况的专家。因此,尽管人工智能可能看起来纯粹是技术性的游戏,但麦克雷表示,其商业伙伴网络对其客户成功至关重要。
“与一个值得信赖的商业伙伴合作非常重要,他们将与客户进行日常互动并了解他们的业务。”他补充说。这就像是在企业的科技之旅中,有一位经验丰富的向导,能够为企业提供专业的建议和指导。
人工智能无疑在所需数据量方面将带来革命性的变化,而VMware的许可证变更也以他们自己的方式引发了一场革命。但McRae表示,除了数据规模之外,存储供应商需要确保升级企业存储以保持同步不是戏剧性的突变。
“你的常规企业将会购买或许可一个模型来使用,他们也将购买或许可一个向量数据库与之配对,他们将获得工具来完成这些工作,”他总结道。“所以我们必须使这一切变得容易。”
让现代IT变得简单意味着提供一种存储基础设施,它提供了端到端的解决方案,包括存储、GPU和计算能力,这些能力集成在一起,可以处理人工智能和其他使用企业数据的应用。