«

谷歌逆袭!AI编程新王诞生?Gemini Pro 2.5 免费击败ChatGPT!

一把老骨头 发布于 阅读:84 科技新闻


在AI编程助手的竞争中,谷歌终于迎来了一次真正的胜利。Gemini Pro 2.5——谷歌最新推出的免费AI模型——不仅成功通过了我的四项标准编程测试,甚至在某些方面超越了ChatGPT,成为目前唯一能与GPT-4抗衡的免费AI工具。

测试1:编写WordPress插件(ChatGPT曾轻松完成,但Gemini此前屡战屡败)
我的第一个测试是让AI编写一个简单的WordPress插件,要求它能随机化输入行并避免重复行相邻。过去,Gemini Advanced(谷歌的付费AI)未能正确生成可用的UI,而Bard(Gemini前身)则完全失败。

但这一次,Gemini Pro 2.5不仅生成了功能完整的代码,还额外优化了用户体验——它自动选择了合适的WordPress图标,使界面更加专业。更令人惊喜的是,代码结构清晰,注释详尽,甚至解释了每一部分的功能。

Gemini Pro 2.5生成的WordPress插件界面

测试2:重写字符串处理函数(Gemini Advanced曾犯下严重错误)
第二个测试涉及美元和美分的字符串处理。2024年2月,Gemini Advanced生成的代码存在致命缺陷——它错误地限制了输入格式,导致“100.50”被拒绝,而“99.50”却被接受。

Gemini Pro 2.5这次完美解决了问题,不仅正确处理了各种输入格式(如“1.00”和“20”),还额外增加了严格的错误检查,并提供了详尽的测试用例。

测试3:定位隐藏Bug(Gemini Advanced曾给出无用建议)
此前,Gemini Advanced在面对一个复杂的WordPress钩子Bug时,仅敷衍地建议“可能在插件或其他地方找问题”。但Gemini Pro 2.5不仅准确找到了问题,甚至用箭头图示标出代码中需要修改的部分,帮助开发者快速修复。

Gemini Pro 2.5用图示精准定位Bug

测试4:跨环境脚本编写(多数AI在此翻车)
最后一个测试要求AI编写一个能在Chrome、AppleScript和Keyboard Maestro之间传递变量的脚本。大多数AI(包括早期的Gemini)难以理解Keyboard Maestro的变量传递机制,但Gemini Pro 2.5不仅正确编写了代码,还额外增加了错误处理和设置指南。

结论:Gemini Pro 2.5正式加入“顶级AI编程助手”行列
代码质量媲美GPT-4,甚至在某些细节(如注释、UI优化)上更胜一筹。

完全免费(尽管目前有速率限制,但足够个人开发者使用)。

响应速度稍慢(约15秒至1分钟),但准确性远超早期版本。

谷歌终于证明了自己的AI实力。虽然Gemini Pro 2.5仍被标记为“实验性”,但它的表现已经足以挑战ChatGPT的统治地位。未来几个月,如果谷歌能进一步提升响应速度并优化商业方案,AI编程助手的竞争将更加激烈。

谷歌 GEMINI CHATGPT