«

苹果AI模型升级遇冷,性能难敌OpenAI旧模型

一把老骨头 发布于 阅读:34 科技新闻


苹果公司近期宣布对其在iOS、macOS等平台上支撑Apple Intelligence功能套件的AI模型进行升级,然而,根据该公司公布的基准测试结果,这些新模型的表现却令人大跌眼镜,不仅未能超越竞争对手,甚至在某些方面还不如旧模型。

在周一发布的一篇博客文章中,苹果公司透露,人工测试人员对其最新的“Apple On-Device”模型生成的文本质量评分与谷歌和阿里巴巴类似规模的模型“相当”,但并未显示出任何优势。这款模型可在包括iPhone在内的产品上离线运行,本应是苹果在AI领域的一大亮点,但现实却让人失望。与此同时,苹果公司功能更强大的新模型“Apple Server”,旨在公司数据中心运行,却也被测试人员评为落后于OpenAI一年前推出的GPT-4o。

更令人惊讶的是,在另一项评估苹果模型图像分析能力的测试中,人类评分者竟然更倾向于选择Meta的Llama 4 Scout模型,而不是苹果的Apple Server。要知道,Llama 4 Scout在多项测试中的表现都不如谷歌、Anthropic和OpenAI等人工智能实验室的领先模型。这一结果无疑给苹果的AI研究部门泼了一盆冷水。

基准测试结果的公布,进一步证实了此前有报道称苹果在AI领域的竞争中处于劣势。近年来,苹果的人工智能能力一直未能达到消费者的期望,承诺的Siri升级也被无限期推迟。一些消费者甚至已经对苹果提起诉讼,指控其在产品中宣传尚未实现的人工智能功能,涉嫌虚假宣传。

尽管面临诸多挑战,苹果公司并未放弃在AI领域的努力。据苹果介绍,拥有约30亿个参数的Apple On-Device模型除了生成文本外,还能驱动摘要和文本分析等功能。虽然这一参数规模在AI领域并不算顶尖,但苹果公司表示,与前代产品相比,Apple On-Device和Apple Server在工具使用和效率上均有所提升,并且能够理解大约15种语言。这得益于苹果公司扩展的训练数据集,其中包括图像数据、PDF、文档、手稿、信息图表、表格和图表等多种类型的数据。

然而,尽管苹果公司在AI模型上进行了诸多改进和升级,但现实却表明,这些努力并未能立即转化为市场上的竞争优势。

苹果 AI