ChatGPT Canvas实测:对不起,它还不是AGI的终极交互形态

科技   科技   2024-10-05 12:48   山西  





大数据产业创新服务媒体

——聚焦数据 · 改变商业


美国时间周四,OpenAI推出了Canvas功能,还没真正用上呢,不少人看着展示视频就纷纷喊着“炸裂”、“震撼”、以及“这就是AGI终极交互形态”。

作为AI领域的“流量密码”,OpenAI每次发布新产品都会迎来一片喝彩,但“一边倒”的热捧真的有理吗?

我们决定不跟风,在拿到Canvas的beta权限并且亲自试用之后,才来和大家分享真实的使用体验。

先说结论:Canvas并不如外界传言般“炸裂”,更不是“AGI的终极交互形态”。

首先,我们来看看Canvas究竟是什么?


简单来说,是ChatGPT里一个内置的新交互体验,可以弹出页面以更好地辅助用户进行写作(writing)和编码(coding)。

你可以通过在提示中输入“使用画布(use canvas)”来手动打开,ChatGPT也会在检测到可能有用的场景时,自动打开Canvas。

进入到Canvas的界面,它会在右下角有几个用于写作和编码的快捷键。

对于写作项目,用户可以要求 ChatGPT 提供编辑建议或长度调整,或者要求它将一段文本的阅读级别从研究生水平降低到幼儿园水平。它还可以添加“相关的表情符号以强调和着色”。

程序员可以让 ChatGPT 审查他们的代码并添加内联改进建议。它还可以用日志和注释标记您的工作,以帮助调试并使您更容易理解代码。它还能够在 Canvas 模式下修复错误并将编码移植到不同的语言,例如 JavaScript、TypeScript、Python、Java、C++ 或 PHP。

更直观的来说,Canvas的推出,就好像ChatGPT同时内置了Notion和GitHub Copilot。

听起来很强大是不是?毕竟Notion号称坐拥1亿用户,年营收2.5亿美元,而GitHub Copilot拥有130万付费用户,年营收20亿美元。

仅仅一个Canvas就能同时提供这两种服务,这简直就是“终极AGI交互的未来”啊,OpenAI的研究员Karina Nguyen最先在推特上发出了这样的“感叹”。

随后,其他舆论也纷纷跟进,一边倒的站在Karina Nguyen身边。

为什么说Canvas既不够“炸裂”也不是AGI终极交互形态?


我们从触发Canvas这一步说起。

在展示视频里,输入“help me write an api webserver in rust”的prompt之后, ChatGPT自动跳转进入了Canvas界面,并生成了代码,就像VSCode的界面那样。

我复制了一段html代码,并要求ChatGPT帮我review一下,在输入这些之后,并没有触发Canvas功能,还是停留在原本的页面。

于是我改变策略,提出了“生成一个用来获取纳斯达克近年来的数据,并进行分析的Python脚本”这样的prompt。

这次才成功触发了Canvas。

目前,ChatGPT并不能100%准确的识别需要触发Canvas的场景,但你可以通过“use Canvas”或者“open Canvas”之类的非常明确的prompt让它直接触发。

在周四公布Canvas功能的博客里,OpenAI也承认目前触发Canvas的正确率分别在83%(写作任务) 和 94%(编程任务)。

编程体验不如微软的GitHub Copilot。

在让ChatGPT Canvas生成代码之后,同样的,我要求微软的GitHub Copilot也基于同样的prompt——“生成一个用来获取纳斯达克近年来的数据并进行分析的Python脚本”——来生成代码,得到了下面的结果:

两者给出了具备基本功能的代码,但ChatGPT生成的代码看起来更细致一些。

在功能多样性上,我们可以看到Canvas界面的右下角,有五个快捷键,分别是:

1.检查代码(Review Code):ChatGPT 提供内联建议,以优化和提升代码质量。

2.添加日志(Add Logs):插入日志语句,以便调试和深入理解代码的执行过程。

3.添加注释(Add Comments):向代码添加注释以使其更易于理解。

4.修复错误(Fix Bugs):检测并重写有问题的代码。

5.移植到语言(Port to a language):将代码转换为 JavaScript、TypeScript、Python、Java、C++ 或 PHP 等编程语言。

这些功能GitHub Copilot也都提供,甚至更多。

初体验上,Canvas和GitHub Copilot打个平手。

但真正超越Canvas的地方在于,GitHub Copilot与开发者的IDE(如Visual Studio Code)深度集成。

GitHub Copilot直接在IDE中工作,为开发者提供实时的代码建议和补全。这种无缝衔接大大简化了工作流程,省去了在聊天界面和编辑器之间来回切换的麻烦。

相比之下,Canvas依托于ChatGPT这样一个聊天工具,开发者仍需要手动将它生成的代码复制粘贴到IDE中,才能运行。

想想看,你是愿意对着一个聊天框苦哈哈地描述你想要的代码,在它生成代码后,手动复制粘贴到IDE里?还是希望在IDE里有个实时跟进的AI助手,在你敲代码的时候默默地跟着你的思路,随时蹦出补全建议?

自动补全功能也是开发者们认为GitHub Copilot优于包括ChatGPT和Claude等提供AI代码编写功能的聊天机器人的地方。

Copilot可以根据开发者刚刚输入的几行代码自动补全后面的代码,这种“联想式编程”极大地提高了代码编写速度,而ChatGPT则需要手动描述任务或询问才能生成相应的代码。

另一方面,GitHub Copilot对项目整体的理解能力是优于Canvas的。GitHub Copilot可以基于整个代码库或项目的上下文来理解代码结构,识别变量、函数、类等内容,而ChatGPT Canvas的代码生成基于当前对话的内容,无法直接读取用户的整个代码文件,因此对项目上下文的理解有限。

而ChatGPT尽管在生成代码、解释概念以及回答编程问题方面表现出色,但在编程效率和与开发流程的深度融合方面不如GitHub Copilot,而这正是开发者最需要的地方。

在文字生成方面,它有的功能Notion都有,而且更强。

为了测试Canvas的文字生成功能,我让它帮我给一位六年多没见的朋友写一封信,表达我的思念之情。

输入prompt之后,ChatGPT自动触发Canvas界面,并且生成了内容。

邮件内容没有什么可挑剔的地方。在界面的右下角依然是有几个快捷键,分别是:

1.建议修改:ChatGPT 提供内联建议和反馈。

2.调整长度:根据需要缩短或加长文档。

3.更改阅读水平:调整阅读难度,从幼儿园到研究生水准。

4.最终润色:检查语法、清晰度和一致性。

5.添加表情符号:加入相关表情符号,增添强调和色彩。

我一一进行了尝试,效果如下图:

整体还是挺丝滑的,没什么可以挑剔的。但我转念一想,Canvas的文字生成体验离让我感到“炸裂”还是挺遥远的,我常用的Notion早有这些功能了啊。

于是我让Notion也给我六年不见的朋友写封信,效果也不差。Canvas五个快捷键包含的功能,它也有,并且还有专门针对文档协作管理的更多细分功能。(如下图)

两年前Notion就推出了beta版本的Notion AI,在上周正式向所有用户开放。

Notion AI采用了包括OpenAI的GPT 和Antropic的Claude 在内的多个大型语言模型,在多样性和灵活性上显然高于Canvas。

另外,Notion AI与Notion现有的组织、标记和链接工具无缝结合,用户可在同一平台内完成从内容生成到组织的全过程,避免了在多个应用间切换的麻烦;充分利用了Notion平台的协作特性,支持团队成员在共享文档中进行实时协作。

这种无缝集成让用户能在熟悉的环境中直接使用 AI 功能,显著提高工作效率,此外,Notion AI 对用户工作环境的深入理解使其能提供更加精准和相关的建议,这是像ChatGPT Canvas这样的独立AI工具难以企及的。

无论是Notion还是GitHub Copilot与Canvas的对比,都指向了关于AGI普及的两种主要发展路径的探讨。

第一种路径由OpenAI、Anthropic等大模型供应商主导。

他们希望将大模型不仅作为基础设施提供,还发展成为一个平台,成为用户接触各类服务的主要入口。

这些公司致力于围绕AI构建更多的应用,形成自有生态系统。例如,OpenAI的ChatGPT不再仅仅是聊天机器人,通过插件集成、与文档和API连接,提供生产力工具的多样化服务,最近的Canvas更是OpenAI“野心”的直接体现。

另一条路径则由软件服务商主导,思路是“为应用加上AI”。

在这种模式下,AI作为现有工具的增强功能,而不是一个独立的平台,其作用在于优化和提升现有软件的智能性和效率。

微软、Google等公司将大模型嵌入到生产力工具中,如GitHub、Word、Excel、Google Docs和Google Emails等,使得用户在熟悉的工作流中享受到智能辅助,如文本自动生成、数据分析和智能建议等功能,更加贴近用户需求,提升工作效率。

这种路径强调的是“增强而非替代”——优化已有工具和流程,而不是另起炉灶,创建一个新的平台。目前来看,用户更倾向于软件服务商推动的这条路径,因为它依托于大众熟悉的工具,无需适应新平台,且实现了无缝的智能化增强。

正因如此,在HackerNews上,开发者们也普遍表达了类似的看法:

“这(Canvas)很酷,但我希望它能集成到已有的编码和写作工具中,而不是作为一个单独的应用程序。”

“如果Apple在Pages等应用中添加类似功能,我一点也不会感到惊讶。看来他们对AI的态度是将其集成到现有应用和体验中,而不是制作独立的AI应用。我觉得这些独立应用更多是技术演示,展示了可能实现的功能,而不是最终普及的应用形态。”

估值越高,OpenAI越“焦虑”


本周三,OpenAI宣布完成66亿美元的新一轮融资,估值达到1570亿美元。本轮融资由Thrive Capital牵头,微软、英伟达、软银、阿联酋投资公司MGX等参投。

尽管这轮融资标志着OpenAI的估值在九个月的时间里翻了一番,但也意味着更大的压力还在前头。

翻开《纽约时报》披露的财务数据,就能看出问题所在:今年OpenAI预计能赚37亿美元,听起来不少了吧?可问题是,光是运营成本和七七八八的开销,就能让公司亏掉50亿美元。

即便收入可观,OpenAI依然“深陷”入不敷出的困境。

更要命的是,投资人也不愿意继续不计回报的“烧钱”了,作为这轮融资的附加条件:公司必须在两年内转型为营利性企业,否则融资将转为债务。

如果无法完成这一转型,OpenAI将面临多重挑战:现金流紧张、债务负担加重、融资能力受限,甚至可能导致公司控制权的改变和创始人股权的稀释。这些潜在风险都将严重影响公司的发展轨迹。

因此,在本轮融资条件公布前,OpenAI已经宣布了架构重组计划,从非盈利向营利部门转型。如今看来,这更像是外部压力下的被动选择。

飞涨的估值也难以掩盖OpenAI对于盈利的焦虑。

Canvas项目的推出是它拓展商业化路径最新的努力,未来我们可能会看到更多类似尝试。

随着OpenAI增强其技术能力和商业模式独立性,它与微软之间的合作关系或许也会更多的演变为“对抗”,例如Canvas与GitHub Copilot的挑战便是一个例证。

然而,核心问题依然存在:AGI的规模化应用何时才能真正实现?只有解决这个问题,才能从根本上降低运营成本、减少亏损。这不仅是OpenAI面临的挑战,也是整个AI行业必须面对的课题。

文:王茜茜 / 数据猿
责编:凝视深空 / 数据猿

数据猿
关注大数据产业的技术应用新媒体。数据猿致力于以大数据的产业应用视角,关注报道金融、工业、医疗、消费等为代表的全行业,并以大数据视角,重点关注人工智能与云计算领域。数据猿也将持续关注物联网、半导体、新能源等重要领域的大数据技术应用及发展情况。
 最新文章