ChatGPT4o升级人机交互模式，人工智能进入“助理”时代，看谁更善解人意

文化 2024-05-20 20:18 河北

文末有福利

入群有惊喜

新媒体运营第248篇文章
作者：胡二刀

头图：孟扬

来源 | 新媒体运营（ID：meitiku）

OpenAI于2024年5月14日正式推出GPT-4o，全语音交互，可以辨别人的语气和情感，可以通过摄像头理解图片，可以顺畅地进行语音翻译，惊艳全场。

紧接着第二天，谷歌发布的最新Gemini模型，同样可以顺畅地语音交互，并通过手机摄像头和智能眼镜来理解物理世界。

无论是ChatGPT4o还是Gemini都几乎完美复刻了11年前科幻片《Her》中的情节，尤其是男主人公为了让AI看世界，拿着手机满世界跑。

人机交互的争霸战已经开打，人工智能进入“助理”时代。现在比拼的是，谁家更“通情达理”，更“善解人意”。

为什么是O而不是5？

本次OpenAI发布的GPT-4o，其中"o"代表"omni"，即全能之意。其不仅在文本处理上达到了前所未有的水平，更在图像和语音处理方面取得了重大突破。

很多人搞不明白，为什么是“o”而不是“5”？

ChatGPT的版本号通常是根据发布的时间和更新的内容来制定的。一般来说，版本号由三部分组成，即主版本号、次版本号和修订号。例如，版本号为 1.0.0，其中第一个数字是主版本号，第二个数字是次版本号，第三个数字是修订号。

当进行重大更新或功能改进时，可能会增加主版本号；当进行一般性的更新或功能扩展时，可能会增加次版本号；当进行小幅修复或优化时，可能会增加修订号。

另外，还可以在版本号后面加入 Alpha、Beta、Gamma、Current、RC (Release Candidate)、Release、Stable 等后缀，对版本进行进一步说明。

OpenAI没有发布5，那就说明本次改进还不够重大，也给以后的升级留下了伏笔。

ChatGPT4o的三个特点

时延非常短，达到了240毫秒，就像跟正常人聊天一样。据官方消息，模型的反应时间已经缩短至平均320毫秒，并且它还能理解人类在对话中适时“打断”的习惯，会及时停下来听你说话并给出相应回复，也不会“断片”。这反应速度已达到人类级别。

原来的人机交互是需要先进行语音识别，转录成文本，然后文本进行回答再合成语音，这样往往有几秒钟的延迟。而现在通过跨文本、视觉、音频端到端的融合大模型，就会感觉到在语音模式下输入输出变得更加灵敏，更符合人感官的要求。

可以提供情绪价值。在聊天的过程中可以带入情感因素，比如焦虑、着急、紧张等，情绪价值直接拉满。比如，研发负责人Mark Chen表示自己因为上台紧张，ChatGPT便温柔地鼓励道：“你在台上做演示吗？那你真的太棒了！深呼吸一下吧，记得你是个专家！”而Mark表示要再来个深呼吸，ChatGPT顺势接话“慢慢呼气”，紧接着Mark一边疯狂地大喘气，ChatGPT惊讶地说：“放松啊Mark，慢点呼吸，你可不是个吸尘器！”

支持多模态交互。GPT-4o是迈向更自然人机交互的一步，它可以接受文本、音频和图像三者组合作为输入，并生成文本、音频和图像的任意组合输出。与现有模型相比，GPT-4o在图像和音频理解方面尤其出色。比如通过摄影头读取人物背景，准确说出其所处的位置。

“助理”时代的使用场景

ChatGPT4o与Gemini塑造了全新人机交互的范式，将人工智能推进到“助理”时代，比拼的是谁家助理更“通情达理”，更“善解人意”。

具体到应用场景中，家居生活是重要选项。原先家里的硬件没有触摸屏，更没有鼠标键盘，所以缺乏人机交互的能力。但“助理”的出现，即可实现人机对话，令硬件设备短时间之内产生响应。比如家里的监控发现有小孩儿爬上了窗台，它会第一时间发出警告，而不是单纯拍摄记录。

推而广之，家里的冰箱、彩电、洗衣机，甚至人型机器人，都可以与人产生交互，比如陪伴老人，做出各种提醒。

同样利用GPT-4o模型，OpenAI和Be My Eyes合作推出了一款APP，可以帮助视力受限人群实时了解身边场景，并提供帮助。他们只要举着手机，就可以“看见”路上和周边的一切。比如路上行驶的出租车是否处于空车状态，提示视力受限人士招手打车，以及车辆是否已经停下。

实时语音转文本和翻译功能可用于在公共演讲、会议或表演中提供实时字幕和翻译，确保听障人士或使用不同语言的人士能够参与活动。

谷歌的Project Astra是一个实时、多模式的人工智能助手，通过接收信息、记住它所看到的内容、处理该信息和理解上下文细节来与周围的世界进行交互，可以回答问题或帮助人们做事情。

甚至在不经意间，Project Astra还展现了它的记忆力。用户问：“你记得我把眼镜放哪了吗？”助手答道，“你的眼镜在桌子上的红苹果旁边。”可以看出，Project Astra通过镜头记住了一闪而过的眼镜。

以上只是“助理”功能的部分应用，从实时语音助手到多语言翻译，从图像识别到复杂的文本生成任务，人工智能的应用场景还有更多等待我们挖掘。

部分资料来自《能说会看！GPT-4o发布，谷歌端上“AI全家桶”反击》

END

新媒体运营人员，整天与电脑手机打交道，颈椎成了身体最脆弱的部分。这套颈椎操，只需五分钟，让你元气满满。欢迎关注“胡二刀”视频号。

-----------以下为福利-----------

点击上图，了解更多新媒体运营秘笈，值得关注哦

【新媒体运营】公众平台回复6

了解“视频剪辑技术"

【新媒体运营】公众平台回复7

了解“新媒体选题策划"

【新媒体运营】公众平台回复8

了解“新媒体系列问答"

【新媒体运营】公众平台回复9

了解“新媒体精品教程"

【新媒体运营】公众平台回复10

入群学习

【新媒体运营】公众平台回复11

了解“新媒体教程课件"

点击以下 关键词 查看历史文章

平台创始人：@胡二刀

资深媒体人、新媒体实战专家

从纸媒到互联网，亲身感受了媒体变迁

新媒体运营（meitiku，也就是媒体库）是一个专门讨论互联网、新媒体、社会化营销原理与技巧的平台，同时兼具对传统媒体的评价与思辩。

新媒体运营全攻略，欢迎关注↓↓↓

转载须知

凡本公众号原创作品

未经授权禁止转载

申请授权请添加小编微信

新媒体运营

涵盖新媒体运营技巧、新媒体运营实务以及新媒体运营理论。账号创始人胡二刀是资深媒体人，有着丰富的网络传播及舆情处置经验。

最新文章

2025逼自己做短剧！月入2w+！

我的“智能”分身诞生了，可以24小时在线，陪你聊天答疑

2025年，企业家急需打造个人IP，再不行动就晚了

视频号与抖音有啥不同？七个方面把这事讲清楚了

吴柳芳解禁，祁天道被拘，公共事件中新媒体应扮演什么角色？

所有运营人，明年的新方向，赢麻了！！！

重拳出击，算法终于要被整治了

突发危机事件中，情况通报能否代替新闻报道？

解锁2024年舆情走势，六大特征重塑信息传播新格局

U盘还是硬盘，固态还是机械？双十一别纠结，省钱方案看过来

刀郎出道二十年，音乐生涯经历三阶段，没有互联网就没有他的今天

特斯拉发布会频出状况，马斯克究竟揭开了哪些悬念？

七问传呼机爆炸事件，民用工具成为军事武器，网络攻击还有底线吗

这个中秋节，我烦透了网红与打卡，文旅的本质同样是复购

“逆行路虎女司机打人事件”分析，关于舆情应对的四点思考

34岁失业了，新媒体运营真的不能干了！

萝卜快跑公众号悄然更换运营主体，百度持续发力自动驾驶

萝卜快跑公众号悄然更换运营主体，百度退出是放弃自动驾驶吗？

“黑神话：悟空”是什么？一场70后与00后的对话，谈到游戏与价值

视频号小店将升级，电商格局或将重塑，再不加入就晚了

胡二刀老师新媒体运营教程课件（共8章45节）

自动驾驶将带来哪些社会变革？这15个猜想或许关乎你的未来

人工智能来势迅猛，众多岗位前途堪忧，效率与公平是鱼和熊掌吗？

从大连公安的情况通报，看突发事件的应急处理，及时全面缺一不可

无人驾驶扑面而来，就业与科技面临选择，按需分配还会远吗？

一部电影背后的启示：科技平权包容差异，让世界更平等

面对突发事件，媒体采访将“有法可依”，“情况通报”或成常态

淄博还火吗？我用三个小时，探访这座城市背后的真相

新闻已死？抛开业务谈流量，那就是耍流氓！

红十字会直升机送烤全羊？各方说法都来了，关键在这里

郭有才为什么会火？背后的推手是谁？算法把我们隔离在不同世界

ChatGPT4o升级人机交互模式，人工智能进入“助理”时代，看谁更善解人意

人工智能向新而行，行业大模型推动新质生产力，赋能千行百业

新能源车改变生活方式，这些行业或将重新洗牌

开鲁春耕事件舆情分析，大幕拉开，有哪些信息值得深究？

重庆燃气事件舆情分析，情况通报背后透露了哪些细节？

猫一杯犯下“五宗罪”，封号还是轻的，自媒体内容创作不能胡来

新媒体人物专访的核心技巧：体验和观察

提灯定损荒唐透顶，给江西抹黑，舆情发酵最需要追责的是这些人

天水麻辣烫虽火爆，但距离淄博还差近三个尔滨

70、80后养老新格局，擎天柱做饭，威震天开车

《周处除三害》大火，短剧手法融入电影拍摄，两大秘诀缺一不可

人工智能的里程碑！Sora带来巨大变革，你准备如何应对？

从人人都是总编辑到人人都是程序员，从ChatGPT到Sora，未来扑面而来

高速卖面与子路受牛，为什么同样值得提倡？

奔驰车主插队砸车事件，四个不按常理出牌，折射网络舆情新特点

代表委员声音｜胡鹏：媒体应最大限度发挥社会稳定“压舱石”作用

小红书，适合普通人的新媒体平台，五大变现方式你选哪个？

2024年迎来人工智能快速发展，赶不上这趟车，你就要被淘汰

短视频引流，实体店老板的成功利器，2024年应该这么做

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉