谷歌将推出接管电脑的人工智能技术

财富   2024-10-28 11:43   北京  

  //  

谷歌研发的“贾维斯”能直接接管浏览器,替你搞定所有网络任务,而它的对手竟是ChatGPT。

据三位直接知情人士透露,谷歌(Google)正在开发一种人工智能,能够接管用户的网页浏览器,帮助完成诸如收集资料、购买商品或预订航班等任务。

据悉,该产品的代号为“Project Jarvis(贾维斯项目)”,其功能与Anthropic公司本周发布的一款产品类似。

其中两位知情人士表示,谷歌计划最早在12月预览这一产品,届时还将发布其下一代旗舰大型语言模型Gemini(双子座),该模型将为这款产品提供技术支持。

这些计划仍处于暂定状态,未来可能会发生变化。

代号“贾维斯”的这款产品名字来源于《钢铁侠》中托尼·斯塔克的AI助手。其开发时间表显示,尽管谷歌研究人员发明了许多底层AI技术,但公司在人工智能领域仍面临来自初创企业的强劲竞争。

例如,谷歌近期仍在研发具备“推理能力”的AI,而OpenAI已在9月推出了类似的AI推理功能,这一进展得益于他们从谷歌聘请了一位2022年帮助发明推理方法的研究员。

这一竞争压力导致谷歌的Gemini聊天机器人严重落后于ChatGPT,众多企业客户纷纷转向使用OpenAI的语言模型,使得谷歌的Gemini模型难以赶超。上周,为提高AI开发效率,谷歌将负责Gemini聊天机器人的团队转移至其主要AI部门DeepMind。根据《The Verge》上周五的报道,下一代Gemini模型预计将在12月发布。

AI开发者们正积极推动“代理”技术(agent),即无需人工监督就能完成复杂任务的AI系统,作为行业发展的下一步。企业软件公司如Salesforce、Microsoft和Workday等,正竞相使用OpenAI及其他公司的语言模型开发AI代理,以实现简单业务任务的自动化,尽管这些代理技术仍在实验阶段。

谷歌和Anthropic正试图将“代理”概念进一步延伸,研发可直接与用户电脑或浏览器交互的软件。OpenAI也在过去一年中积极开发类似软件。据两位知情人士透露,谷歌的“贾维斯”代理与Anthropic推出的产品类似,能够通过频繁截取电脑屏幕截图来分析当前界面内容,并根据用户指令采取行动,比如点击按钮或在文本框中输入信息。

不过,这两家公司代理软件在功能上存在重要差异。Anthropic表示,其产品可以操作用户电脑上安装的不同应用程序,而谷歌的贾维斯则仅能操作网页浏览器,并且专为Chrome浏览器进行了优化。

退换鞋子

三位消息人士称,至少目前,Jarvis主要面向希望自动化日常网络任务的普通消费者。例如,在今年春季谷歌开发者大会上,首席执行官桑达尔·皮查伊(Sundar Pichai)暗示,未来版本的Gemini或许可以自主执行多项操作,帮助用户完成退换鞋子的任务。

相比之下,Anthropic则将其智能代理定位为可以帮助软件工程师和其他办公人员提高工作效率的工具,尽管Anthropic也表示,人们可以将其用于规划与朋友的日常出行等个人事务。

Anthropic展示了一款实验性的计算机助手,能够处理工作和个人任务。

据两位消息人士透露,谷歌可能会首先将Jarvis发布给一小部分早期测试用户,以帮助识别和解决其缺陷。目前,这款智能助手的操作速度较慢,因为模型在执行每个操作前需要花费几秒钟进行思考。

谷歌需要说服用户,相信其AI助手能够安全处理他们的个人数据,包括登录密码和信用卡信息。这些信息对于AI助手访问不同网站、根据客户需求完成任务或进行购买至关重要。

众所周知,大型语言模型(LLM)偶尔会给出错误答案。例如,谷歌在搜索引擎中使用LLM驱动的对话式回答时,最初就出现过不少明显错误。(The Information)








AI新智能
一个致力于探索人工智能对商业世界和社会影响的平台。
 最新文章