阿虚同学
读完需要
速读仅需 5 分钟
几个月前的 5 月 14 日凌晨,OpenAI 发布会拿出 GPT-4o 的 АΙ 视频通话功能演示时,几乎全网都在震惊高呼
▲发布会演示,数学计算
当时所见,就在感慨:没想到 15 年底发布的游戏《命运石之门0》里面所幻想的视频通话 АΙ,我们在 24 年就能看到简单的雏形了
▲动漫中名为Amadeus的视频通话АΙ
说实话,阿虚一直都很想实际体验一下,毕竟这是我最喜欢的动漫之一
但结果怎么着?GPT-4o 说好的视频通话功能是一拖再拖, 谷歌后续跟着推出的类似功能 Project Astra 也是到现在也没见着个影子...
1
国内首个 AI 视频通话
最后没想到的,这个功能我最先还在智谱清言 App 上体验到——这也是国内首个可以全民体验的 АΙ 视频通话应用
别的先不说,就凭抢在 OpenAI 和谷歌之前,先让国内用上 АΙ 视频通话这一点,咱也得说个智谱牛逼
无需申请,现在打开智谱清言 APP 点击右下角电话图标,再点击摄像头,即可为清言点亮 “ 双眼 ” 👀
2
强悍的视频理解能力
我首先用了 GPT-4o 发布会上相同的演示内容对智谱清言进行测试,可以看得出清言的表现几乎和 4o 是一致的
同时对周围环境的感知能力,在阿虚看来也是基本过关的
我试着让他看了下我的电脑桌,键盘、鼠标、MacBook、矿泉水瓶、纸巾都没有遗漏,纸巾颜色、甚矿泉水是多少毫升的都没基本没错
3
АΙ 视频通话
还能用来干啥?
当然老实说,虽然第一次实际体验到这种科幻照进现实的感觉很是新鲜,但新鲜感一过,还是会想「这东西目前有没有实际用途?」
好好考虑了一番,阿虚是这样想的:重要的不是 АΙ 能看懂我已经懂的东西,而是她还能看懂我不懂的东西!
比如有时候想偷偷摸摸薅点老婆的化妆品来护护肤,结果发现各种瓶瓶罐罐一个都看不懂,这下好了,有了清言,问题解决起来轻松多了
又比如走在路上碰见一辆没见过的车标,很是感兴趣,再不用像原来一样拍照回去识图啥的了,只需要你拿出清言一问就能一秒了解
转头撞见一只很可爱的猫,想以后养一只一样的,但不知道是什么品种?没事,拿出清言问一问~
再扯远一点,比如说「重生之我在云南摘菌子」,有幸依靠清言捡回的第 99 条命
总之,各种你不懂不知道的物品、动物、植物,现在都有了一个 АΙ 助手可以请教!这不简直是逮了一个什么都懂的「狐主任」回家嘛....
更别说阿虚觉得,АΙ 视频通话功能的出现,简直就是给教育行业的又一次毁灭性打击
相比传统的拍照上传让 АΙ 教题,现在你只要把手机一架,真心就可谓是一个 24 小时可以随时在线的私人家教,目前小学、初中的题目基本上都没有问题,随着以后算力的提升,这方面的教学体验与效果怕更是想都不敢想
而且大家应该能从视频看得出,清言不只是能替你解题做答。最关键的是 АΙ 和真人家教一样,在解题的时候,会一步步引导着你去做题,让你有一个自己思考的过程!
更别说在英语学习中,简直是一个全能外教!拼写、听力、口语样样精通,无时无刻实时耐心教学,简直吊打所有传统英语学习类产品
而且不是像上面视频那样只能读单词,清言可谓真正的指哪儿读哪儿
以后还买什么几百上千的点读笔、点读机啊,智谱清言不仅完全可以胜任,而且效果更好!毕竟你还可以和她实时进一步交流对话
而且「点读机」这个应用场景你思路再打开一下,同样的使用方法用来看国外漫画也不是不行
想要在 АΙ 时代不被落下,脑洞有时候比产品更重要,大家不妨可以大胆想象一下视 АΙ 频通话都能干什么,自己打开智谱清言去试一试
当然,智谱清言 APP 目前的 АΙ 视频通话功能还属于产品的初级阶段,小瑕疵仍然不少,有时候会识别错东西,不断重复一段回答,不过整体出现概率不大
其实国内能推出这类产品最大的意义,阿虚觉得还是让普通用户也能真正「提前触碰到了未来」
今后将 АΙ 装到眼镜上,结合 AR 技术,钢铁侠里面的贾维斯不就成真了吗?
再或者装到盲人的拐杖上,几十万的导盲犬成本不就下来了吗?亦或者结合汽车的 360° 影像,让机器人理解所看到的东西,实现真正的智能驾驶、无人驾驶(不会再傻呗一样堵在路中间了).......
未来的 АΙ 究竟能做到什么程度,科幻场景会不会一个个成真,还真的是让人期待呀
PS:智谱清言的 АΙ 视频通话功能目前完全免费开放中,大家可以扫描下方二维码到官网下载 APP 自行体验
👇点击“阅读原文”也可下载智谱清言~