«

从阿斯特拉到Google Meet翻译:谷歌I/O的人工智能工具颇具震撼!

一把老骨头 发布于 阅读:22 科技新闻


在2025年的谷歌I/O大会上,谷歌以其一系列令人瞠目结舌的人工智能工具,再次引领了科技界的潮流。这些工具不仅承诺在不久的将来提供科幻小说般的便利,更将深刻改变我们工作和娱乐的方式。尽管我们尚未迎来机器人式的飞行汽车,但谷歌的机器人助手罗西(以Project Astra为代表)已蓄势待发,准备为我们的日常生活带来前所未有的便捷。

  1. 阿斯特拉计划:你的全能私人助理,让生活更轻松
    Project Astra,这一曾被戏称为下一代人工智能助手的计划,如今已逐渐揭开其神秘面纱。作为谷歌DeepMind计划的一部分,Astra旨在通过多模态输入理解并交互于你周围的世界。在谷歌I/O大会上,Astra展示了一项令人印象深刻的能力:当用户请求帮助修理自行车时,它不仅能够迅速在互联网上搜寻PDF格式的手册和油管教程,还能直接打电话给当地的自行车商店询问零件信息。整个过程中,用户几乎无需进行额外的交互,Astra便能自主处理来自多个来源的信息,管理多项任务,并与用户保持自然流畅的对话。

对于像我这样讨厌预约或预订的人来说,Astra无疑是一个技术上的福音。无论是通过网络还是电话,Astra都能轻松应对这些繁琐的任务。此外,在厨房忙碌时,Astra还能成为寻找食谱的好帮手。据悉,Astra项目将于今年晚些时候正式推出,届时,我们的生活将因这位全能私人助理的加入而变得更加轻松。

  1. 谷歌Chrome中的Gemini:网络浏览的智能升级
    谷歌的双子座聊天机器人(Gemini)即将登陆Chrome浏览器,为ChatGPT等聊天机器人带来激烈的竞争。目前,Gemini已可通过专用网站和移动应用程序访问,但此次与Chrome的集成将实现更多独特功能。用户可以在浏览网页时提出问题,Gemini将为其总结内容、阐明细节,甚至从过去的浏览会话中检索信息。此外,用户还可以通过语音与Gemini交流,进一步提升浏览的便捷性和效率。

这一集成对于提升生产力和可访问性具有重要意义。摘要功能虽然实用,但Gemini的澄清能力更能帮助用户深入理解和重新组织正在阅读的内容。同时,从多个选项卡中访问信息而无需切换,也让用户能够更专注于其他任务。无论是浏览网页还是购物,Gemini都能成为用户的得力助手,帮助用户集思广益、挑选信息或检查错误信息。据悉,Chrome中的Gemini将于5月21日开始发售,但仅面向谷歌AI Pro和Ultra订户。

  1. 水手计划:购物与生活的智能管家
    Project Mariner是专为谷歌AI Ultra订户设计的Chrome浏览器智能助手,能够主动浏览互联网并代表用户执行任务。与Project Astra不同,Mariner更专注于在web浏览器中运行,为用户提供查找信息、进行研究、预订航班和酒店以及进行购买(经许可)等一站式服务。

在谷歌I/O大会上,Mariner的演示令人印象深刻。它不仅能够搜索房地产列表、进行预订,还能帮助用户购物。对于像我这样考虑购房的人来说,Mariner无疑是一个福音。它可以根据用户指定的标准搜索互联网,找到潜在的房产进行比较,并为用户提供详细的报告。此外,Mariner还能搜索最佳价格、将商品添加到购物车并发送给用户进行审批。这一功能不仅节省了用户的时间和精力,还让购物变得更加轻松和高效。

  1. 增强的内容创建工具:让创意无限延伸
    谷歌更新了其两个最强大的创作工具:Imagen和Veo。Imagen 4(在Gemini中可用)支持2K分辨率图像,并增强了对织物、毛皮和水的纹理渲染能力,旨在生成更逼真的图像。同时,它还为Docs、Slides和Vids等应用程序集成了Google Workspace,让用户可以直接在工作流程中生成图像。

对于电影制作爱好者来说,Veo 3则是一个不容错过的工具。它提供了令人震惊的人工智能视频创作能力,能够创造出栩栩如生的图像和视频内容。尽管人工智能生成的内容创作是一个有分歧的话题,但从消费者的角度来看,这些强大的创作工具无疑将极大地丰富我们的创作手段。尽管目前这些工具尚未完全向公众开放,但其潜力已不容忽视。随着技术的不断进步和成本的降低,我相信这些功能很快将渗透到消费者手中。

  1. Google Meet的实时语音翻译:跨越语言的沟通桥梁
    实时语音翻译一直是我梦寐以求的未来科技之一。而谷歌正在为Google Meet开发的近实时语音翻译功能,无疑让这一梦想更近了一步。该功能以自然对话为目标,目前的测试版已支持英语到西班牙语的翻译,未来几周内还将支持更多语言。

谷歌 AI