OpenAI即将推出智能体 能控制计算机并独立执行任务

科技   2025-01-27 21:00   安徽  

| I | T | 报 | 

聚焦IT.互联网.通信.数码揭示科技潮流最新走向

【微信号:ITnewspaper】

据外媒报道,人工智能初创公司OpenAI本周将发布一款能够控制计算机并独立执行任务的AI智能体(AI agent),项目代号为 “操作员”(Operator),有望成为人工智能领域的一大飞跃。
OpenAI准备在本周推出Operator,它可以在用户的网络浏览器中代表用户完成任务。Operator 将为用户提供旅游、餐饮和活动等类别的建议提示。例如,用户可以让Operator帮他们找到从纽约飞往毛伊岛(Maui)的最佳航班,而且不会让他们在晚上太晚降落。Operator不会完成交易,用户将最后完成结账流程。
外媒称,Operator可以在某些方面发挥作用。不懂电脑的老年人可以要求Operator帮助他们发送电子邮件,看到Operator导航到邮箱,并为他们打开撰写窗口。
精通技术的人可能不需要这种帮助,但老年用户在浏览网页时常常会遇到困难,即使是完成简单的任务也是一项挑战。Operator还可以在其他领域提供帮助,例如在质量保证测试中,公司可以利用AI服务,测试其新网站或服务是否能正常运行。
不过,所谓的 “计算机使用代理 ”也存在潜在风险。目前,已经有初创公司推出了一种网络导航机器人,可以自动完成在社交平台Reddit上发布营销垃圾邮件的过程。AI初创公司需要采取一些措施打击滥用行为,否则网站上的垃圾信息将比现在更加泛滥。
Operator这样的智能体基本上是通过截取用户浏览器的屏幕截图,然后将图像发送回OpenAI进行分析。它利用了OpenAI和其他公司一直在开发的多模态技术,该技术可以解读多种形式的输入信息,比如文本和图像。
所有领先的人工智能公司都已承诺推出自主人工智能代理,OpenAI首席执行官阿尔特曼(Sam Altman)去年曾表示:“我们会有越来越好的模型”,但 “我认为下一个巨大突破将是智能体”
AI初创公司Anthropic去年就推出了 “计算机使用 ”功能,通过API接入,开发人员可以指导Claude使用计算机,就像人们看屏幕、移动光标、单击按钮和输入文本一样。Claude能够将指令(例如,“使用我的计算机和在线数据填写此表单”)转换为计算机命令(例如,检查电子表格;移动光标打开web浏览器;导航到相关网页;使用这些网页中的数据填写表单等等)。
AI公司面临着越来越大的压力,AI模型成本高昂,它们必须找到变现方式:人们希望智能体能成为下一个突破性产品,一个具有ChatGPT影响力的创新。

欢迎小伙伴在底部发表神评,与我们交流!

IT报:大家都在看的公众号,你关注了没

 因为微信更改了推送规则,推文不再按照时间线显示,如果不点『在看或者没有『星标』,可能就看不到我们的推送了!如果不想错过精彩内容,就赶紧星标我们吧

IT报
聚焦IT、互联网、数码等行业新闻,致力于提供最鲜活的IT产业资讯,第一时间报道行业重大事件。以独特视角、犀利风格揭示IT产业走向,众多IT大佬都关注了!你还在等啥呢?投稿或合作请加V yeqw01 或Q 1945507743
 最新文章