苹果AI模型升级遇冷，性能难敌OpenAI旧模型

一把老骨头发布于 2025-6-20 08:04 阅读：96 科技新闻

苹果公司近期宣布对其在iOS、macOS等平台上支撑Apple Intelligence功能套件的AI模型进行升级，然而，根据该公司公布的基准测试结果，这些新模型的表现却令人大跌眼镜，不仅未能超越竞争对手，甚至在某些方面还不如旧模型。

在周一发布的一篇博客文章中，苹果公司透露，人工测试人员对其最新的“Apple On-Device”模型生成的文本质量评分与谷歌和阿里巴巴类似规模的模型“相当”，但并未显示出任何优势。这款模型可在包括iPhone在内的产品上离线运行，本应是苹果在AI领域的一大亮点，但现实却让人失望。与此同时，苹果公司功能更强大的新模型“Apple Server”，旨在公司数据中心运行，却也被测试人员评为落后于OpenAI一年前推出的GPT-4o。

更令人惊讶的是，在另一项评估苹果模型图像分析能力的测试中，人类评分者竟然更倾向于选择Meta的Llama 4 Scout模型，而不是苹果的Apple Server。要知道，Llama 4 Scout在多项测试中的表现都不如谷歌、Anthropic和OpenAI等人工智能实验室的领先模型。这一结果无疑给苹果的AI研究部门泼了一盆冷水。

基准测试结果的公布，进一步证实了此前有报道称苹果在AI领域的竞争中处于劣势。近年来，苹果的人工智能能力一直未能达到消费者的期望，承诺的Siri升级也被无限期推迟。一些消费者甚至已经对苹果提起诉讼，指控其在产品中宣传尚未实现的人工智能功能，涉嫌虚假宣传。

尽管面临诸多挑战，苹果公司并未放弃在AI领域的努力。据苹果介绍，拥有约30亿个参数的Apple On-Device模型除了生成文本外，还能驱动摘要和文本分析等功能。虽然这一参数规模在AI领域并不算顶尖，但苹果公司表示，与前代产品相比，Apple On-Device和Apple Server在工具使用和效率上均有所提升，并且能够理解大约15种语言。这得益于苹果公司扩展的训练数据集，其中包括图像数据、PDF、文档、手稿、信息图表、表格和图表等多种类型的数据。

然而，尽管苹果公司在AI模型上进行了诸多改进和升级，但现实却表明，这些努力并未能立即转化为市场上的竞争优势。

苹果 AI