首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

OpenAI canvas一夜封神！超强AI编码研究神器，ChatGPT再次颠覆人机交互

职场 2024-10-11 08:50 浙江

转自：新智元

【导读】ChatGPT横空出世以来，首次迎来界面史诗级升级！全新canvas界面，开启了人类与AI协作研究、编码的新时代，更代表着终极AGI人机交互形态。

时隔两年，ChatGPT终迎来界面全新升级！

这一次，OpenAI官宣推出canvas。它不再是简单的对话框，而是能与ChatGPT「并肩作战」的全新界面。

不论是写作，还是编码，都可以开启全新的合作方式。

canvas基于GPT-4o构建，目前仍在测试阶段，可在所有模型中手动选择。

而且所有Plus用户不用等待，直接可用。未来，OpenAI还计划向所有免费用户全面推出。

canvas不仅可以让你与ChatGPT一起做研究，还能写代码、邮件等等，最重要的是还能帮你一起脑洞。

有趣的是，canvas还可以添加emoji。奥特曼在线发起投票，看看有多少人喜欢这个功能。

另外，canvas面板中，还多了一个快捷菜单，让协作更加轻易便捷了。

审查代码、修改bug、添加评论、log等等，一键完成。

在Canvas界面助力下，GPT-4o编码性能飞跃18%！

这是要纷纷取代了GitHub Copilot、Cursor编码神器了。网友们惊叹道，OpenAI绝杀了Cursor。

还有人说，canvas的推出，是OpenAI对最大劲敌Anthorpic的Claude artifacts最大的回击。

在经历如此巨大人事变动同时，OpenAI近日多次发布更新，是向外界、投资者给出了我们依旧有实力的反馈。

话不多说，看看历经两年，ChatGPT究竟带了怎样划时代的巨变。

肝代码研究，原来这么轻松

canvas项目负责人Karina Nguyen表示，我对终极AGI界面的愿景，是一张空白的画布。

随着时间的推移，它会根据人类偏好，自我改进。

而且，它会创造与人类互动的新方式，重新定义人类与AI，以及整个互联网的联系。

canvas便是，这样一种终极AGI界面的完美「代言人」。

那么，它究竟如何帮人类研究、写代码、创作呢？

接下来，让我们一睹为快。

做研究

当你需要完成一项艺术史研究报告，在canvas便可以完成研究。

首先，将你的需求告诉ChatGPT，它便开始搜索一切所有相关的报道——Rembrandt的自画像技巧。

随之，canvas在屏幕右侧开启了全新界面，一篇研究报告，正在速成。

当你对其中生成的一句话，不太确定是否正确。只需要选中，然后即刻就能唤醒ChatGPT，随地取问。

又或者，当你想要更改文中的小标题，不如让ChatGPT给点建议。

最惊艳的是，右下角「铅笔」样子的图表，可以开启文献的阅读模式，可以一句一句地浏览。

最后，你可以让ChatGPT为你添加参考文献、书目引用。

写邮件

你还可以让ChatGPT搜索一家最好的餐厅，它会帮你汇总所有在SF城市米其林餐厅。

然后让它在为你写一封邮件，发给最好的朋友。

写代码

另外，你还可以在canvas界面中，完成代码的生成，还是可以编辑的那种。

以往ChatGPT只是给出结果，并不能一同编辑。

让ChatGPT用Rust写一API网络服务器，它便同以往一般，为你生成了代码。

然后，要求对其中一段代码，添加登录注册路由。

并且，你还可以自己改写其中的内容。

在界面右下角，还有一个工具栏，可以进行代码审查、转换语言、修改bug、添加log、还有添加评论功能。

比如，针对刚刚生成代码进行审查，以及修复bug，ChatGPT瞬间就完成了。

发明新食谱

更惊艳的是，在canvas模式下，还可以创造发明新的idea。

比如，你想做一个不一样的苹果派，可以让ChatGPT搜索总结出，最通用的苹果派的食谱。

假设你没有其中一种材料——Nutmeg（肉豆蔻），然后你们可以一同创作全新的做法。

与ChatGPT并肩作战

目前，ChatGPT已常被用于协助写作和编码方面的任务。

尽管聊天界面易于使用并且适用于许多任务，但对于需要编辑和修订的项目，仍然有些不便。

canvas的推出，正是要为这类工作提供新的界面，而且能让ChatGPT更好地理解用户提供的任务上下文。

当ChatGPT检测到可能有帮助的场景时，canvas会自动打开，也可以直接在提示词中包含「使用canvas」的字样来处理现有项目。

对于写作任务，快捷编辑栏中包含5种选项，从下至上依次为：

- 建议编辑：ChatGPT为指定内容提供内联建议和反馈

- 调整长度：将文字内容编辑得更短或更长

- 更改阅读级别：调整文字的阅读难度，从幼儿园到研究生院

- 最后润色：检查语法、清晰度和一致性

- 添加表情符号：为强调或有颜色标记的内容添加相关emoji符号

比如，可以高亮特定部分来引起ChatGPT的关注，并让模型在考虑整个项目的同时，提供内联反馈和建议。

奥特曼还发起了在线投票，「添加emoji是不是OpenAI有史以来发布的最好功能？」

对于编码任务，快捷键又和写作不同：

快捷键从下至上依次为：

- 检查代码：ChatGPT提供内联建议以改进代码

- 添加日志（logs）：插入print语句以帮助调试和理解代码

- 添加注释：为代码添加注释

- 修复bug：检测并重写有问题的代码以解决bug

- 移植到一种语言：将您的代码转换为JavaScript、TypeScript、Python、Java、C++或PHP

「点到哪里改哪里」，修改代码也将和修改文字一样直观简单。

为什么要更新用户界面？

OpenAI在博客中表示，如果要让人工智能变得更有用、更易用，就需要重新思考我们如何与它互动。而canvas，就是一种全新的方法，未来还将经历快速迭代。

终极AGI界面canvas，GPT-4o也被优化了

为了让模型更适应canvas模式，团队也对GPT-4o进行了必要的修法，添加了一些核心行为：

- 触发canvas的打开，进行书写和编码

- 生成多样化的内容类型

- 进行有针对性的编辑

- 重写文档

- 提供内联形式的修改意见

值得一提的是，对GPT-4o进行的这些训练采用了OpenAI的合成数据生成技术，包含了从o1模型中提取的输出。

此外，团队还使用了20多项自动内部评估来衡量进展情况。

首先，一个关键的挑战是定义何时触发canvas。模型既需要灵敏识别有检查、修改需求的任务，比如「写一篇关于咖啡豆历史的博客文章」，同时也要避免过度触发，比如「帮我做一份新的晚餐食谱」这种一般的任务就不太需要canvas。

与带有提示指令的基线模型相比，调整后的GPT-4o的触发决策正确率分别达到了83%和94%

第二个挑战涉及在canvas被触发后调整模型的编辑行为，特别是决定何时进行有针对性的编辑而不是重写整个内容。

这就要训练模型，在用户明确选择文本时，更倾向于执行有针对性的编辑而非重写。随着模型不断完善，这种行为的能力也在不断发展。

相比基线模型，带有canvas的GPT-4o在写作和编码任务上有18%的性能提升

最后，训练模型以生成高质量的代码注释同样需要细致的迭代过程。

这个评估任务与前两种情况不同。canvas是否触发以及是否进行了有针对性的编辑行为，很容易进行自动化评估，但以自动化方式衡量代码注释的质量，因此团队选择了人工评估。

相比基线模型，集成canvas后的GPT-4o在注释准确性方面有30%的提升，质量提高了16%。

这表明，与带有详细指令的零样本提示相比，合成数据的训练显著提高了模型的响应质量和行为。

网友玩疯了

canvas一经发布，已在全网掀起热议。

Every初创公司创始人表示，很明显，OpenAI不仅仅是在构建聊天机器人，他们还试图为AI时代构建一种全新的操作系。

一名开发者表示，canvas界面是游戏改变者。

他刚刚通过canvas和ThreeJS一起创建了一个tesseract/Hypercube可视化工具，并称自己喜欢统一的UX聊天、在线评论和观看GPT-4o在代码上发挥其魔力，所有这些都在一个地方完成完成，永不过时。

还有网友表示，canvas界面做的非常好，而且一切都是实时流畅的。

不过，它让我们意识到一个重要的问题，我们还不确定与AI协作写作的最佳方式是什么。

话虽如此，canvas让工作更加集成集成（cyborglike），而不是简单地轮流进行任务（centaurlike）。

还有人纷纷悼念Cursor。

核心贡献团队

canvas背后核心团队也随之全部公布。

研究主管是Karina Nguyen，还有3位核心研究人员Kai Chen, Michael Wu, Tarun Gogineni，12位核心工程/产品/设计师。

值得一提的是，提供支持技术领导人当中，还有离职的CTO Mira Murati。

Karina Nguyen

在加入OpenAI之前，Karina Nguyen曾在Anthropic任职，专注研究模型对齐能力和诚实研究，以减少LLM的幻觉。

值得一提的是，她曾领到了Claude Instant 1.2训练，在API中制作了该模型。

此前，作为一名设计工程师，Nguyen与Primer.ai、Dropbox、Square和《纽约时报》的团队在研发原型、新闻工具和产品功能方面进行了合作。

Kai Chen

Kai Chen在宾夕法尼亚大学获得了计算机科学本科学士学位。

她于2023年初加入OpenAI，此前Kai Chen还联合创办了两家公司，一个是AI助手领域的Dispatch、还有一家自动化劳动任务项目的Port Tecjnologies。

Michael Wu

Michael Wu目前是OpenAI的应用研究员。

此前，他曾以应用研究科学家身份，在Facebook工作了三年，任职期间训练了自然语言理解和深度学习模型。

此外，他还在Primer AI担任机器学习工程师、Dropbox担任软件工程师，在Naver Corp担任机器学习实习生，在苹果公司担任机器学习实习生。

2015年，Michael Wu在麻省理工学院获得了计算机科学和数学学士学位。

参考资料：

https://openai.com/index/introducing-canvas/

https://x.com/karinanguyen_/status/1841889811931791642

推荐阅读点击标题可跳转

1、刚刚，诺贝尔物理学奖颁给AI教父！

2、深度学习六十年简史

3、开源 9 年后，词频数据库 wordfreq 宣布停止更新，创始人：网上全是垃圾，OpenAI 和谷歌要为此付出代价

Python开发者

点击获取精选Python开发资源。「Python开发者」日常分享 Python 相关的技术文章、实用案例、工具资源、精选课程、热点资讯等。

最新文章

突发！GitLab不再为中国大陆、香港、澳门提供账号服务，60天不迁移或被删除账号

我用免费大模型DIY了个作业批改助手，手机端可用！

Python即将成为TIOBE 2024年度编程语言

劝大家早点拿下软考证，风口已经很明显了

哗然！MIT教授NeurIPS演讲公开歧视中国学生，大会官方认错、本人道歉

分享 7 个用 Python 开发成的数据库

GitHub 公开评测，国产 AI 表现……

GitHub谎报了Copilot的统计数据！两年了，我们还是没办法证明AI编程助手能提高代码质量

再用 `print` 进行 Python调试，你就OUT啦！

惊掉下巴！被字节起诉800万实习生，拿下NeurIPS 2024最佳论文

Python 3.13 中的 7 个新类型特性

最强图解微型神经网络--多层感知器

美国教授痛心：UC伯克利GPA 4.0计算机本科生，毕业即失业？ML博士直呼太卷后悔转行

三种 Transformer 模型中的注意力机制介绍及 Pytorch 实现：从自注意力到因果自注意力

字节起诉前实习生，索赔 800 万

吴恩达出手，开源最新Python包，一个接口调用OpenAI等模型

信息论、机器学习的核心概念：熵、KL散度、JS散度和Renyi散度的深度解析及应用

陪你一起刷题面试，字节跳动又出了一款新工具

失业小哥在父母卧室做AI应用，日入2万刀！晒账单爆火全网，AI初创价值3500万

B站知名up主何同学被指盗用开源项目——网友锐评「移源丁真：鉴定为自研」

太荒谬了！千人公司一刀切禁用 JetBrains，非俄籍“备胎” VSCode 上位

强烈建议尽快搞个软考证！（重大利好）

阿里全球数学竞赛决赛结果公布，姜萍违反预选赛规则未获奖

裁员了，很严重，今年千万别离职

用Python实现十大经典排序算法(附动图)

字节回应大模型训练被实习生攻击

Python协会曝出丑闻：49万元被“熟人”挪用，发现时账户仅剩183元，险些破产

裁掉数千人、把工作外包给 AI！一年多后，这家巨头的 CEO 恳求无人搭理，预算还要超 5 亿？

Python3.8即将结束生命周期

时间序列特征提取：从理论到Python代码实践

OpenAI canvas一夜封神！超强AI编码研究神器，ChatGPT再次颠覆人机交互

一文让你搞懂 Python 的 pyc 文件

刚刚，诺贝尔物理学奖颁给AI教父！

深度学习六十年简史

17岁开发 AI 应用，4个月入账700万，开学第一天晒账单火了

腾讯居然还自研了 Git 客户端，也是没想到…

开源 9 年后，词频数据库 wordfreq 宣布停止更新，创始人：网上全是垃圾，OpenAI 和谷歌要为此付出代价

突发！高通拟收购英特尔；大连思科再裁员，补偿 N+7

谢尔盖布林：谷歌不敢用Transformer，作者剩一人了，现在我每天都在写代码

PyTorch官宣：告别CUDA ！

“神仙外企”、“IT养老院”前员工忆往昔：曾经是乌托邦、工资多得花不完只能买房

3个完美替代 Navicat 的工具，香！

又一款 AI 编码工具火出圈！OpenAI 投资、碾压 VS Code、8 岁女孩用它 45 分钟就能构建一款聊天机器人

韩国N号房卷土重来，这一次是Deepfake，波及超200所学校

谷歌SRE工程师打拼9年：年薪超60万美元、钱赚够了、对技术不再那么热爱

机器学习中的样本重要性权重 (Importance Weight)

谷歌推世界首个AI游戏引擎，2000亿游戏产业恐颠覆！0代码生成游戏，老黄预言成真

突发！IBM中国研发岗访问权限一夜关闭，千人或被裁

终于有人将Transformer可视化了！

下载量超 5000 万的知名应用，开发团队“全军覆没”，从此发版人唯剩老板一个

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉