不知怎么的,对人类的要求越来越强调纪律、安全,规训与惩罚。反而机器正走向另一端。
GPT的最新语音版本,正全面模仿人类的语气和情感,在认知上也更加接近人类——尝试理解的对象,从话语内容到语气、再到人周遭的环境。事实上人与人沟通可能有一半的信息都从语言之外而来,这也是为什么人类能跨语言交流。AI正在闯入信息深水区。
机器变得越来越有人情味,甚至变得更能解决人际问题。
AI帮小伙子聊天撩妹是个高速发展的应用。甚至再也不用担心微信上破不了冰。而可怜的胖猫...甚至砸钱都赢不下人心。被指责无法提供虚无但又刚性的情绪价值。如果他有一个AI分身呢?就像《守望者》里的曼哈顿博士可以一边科研,一边抚慰女友。
多模态的成熟使得机器越来越像人,甚至变成效率更高的超人。
我非常喜欢用语音输入,但同时喜欢读文字。因为语音输入比打字效率更高,而一目十行阅读又比听觉效率高。
AI在两种输入输出上都已不落下风。
多模态还能进一步促进信息的搜集。大量的信息埋没在手机、眼睛和耳朵里。前者是人造器官,后者是天生器官。
随着手机厂商迈向AI决心加大、多模态出现使得智能硬件真正智能起来,都会诱导人类和大模型交互、存储下更多非结构化数据,造就新的硬件机会。
没有搭载AI的硬件会变得就像当年的功能机。
我们日常随机的对话、指数级增加的摄像头带来的海量视频,总有一天会投喂给AI, 让AI变得更拟人。
因此我毫不担心中国的大模型。跟随式创新+海量数据+低门槛搜集带来的优势太强了。
但另一方面,人又更像机器了。
所有城市的地铁站里,都有一群机械执行安检动作,甚至无目的站立的安全人员。从国际比较来说必然是冗员的。对其智能的应用仅不到20%。更大的价值在于作为紧急情况的后备力量,到时候才可能用上其一半以上的潜能,需要真正人类级的判断、应急、协调。
但在平时,这就是一个闲置的、低功耗的、便宜的大模型。如果按一个月5000的工资来算,每小时大概是28元人民币,具有完美的具身智能和交互能力,每分钟可以进行多轮对话。可以在遇到紧急情况时汇报、求援、自行组织起来。
如果是chatgpt-4这样的大模型成本要多少呢?虽然很难比较,因为大模型同时和几百万用户对话。但如果只考虑和单一用户对话,不断输入输出信息的单个大模型,成本多少?
我直接问了GPT。
他给我的回答是每小时9美金。
虽然有自抬身价的嫌疑,但即使砍半,也比我们一个安全员的成本高。
如果一个社会对人的主要要求是简单智能、闲置为主、为偶发事件冗员,那人很可能越来越机器化,而且太便宜,甚至比机器性价比更优。
基层人员很多时候也陷入了机器化。大量的表格填报、整理数据、公文写作在占据智能使用。而这些恰恰是大模型和软件最擅长的。为什么仍然要用人来完成?因为人省事,可以以低成本智能应对格式永远在变、数据需求永远不清晰不确定的场景,而不用预先设计、优化流程。还能应对不同领导、不同上级部门的需求。当然,更重要还是因为需要人来处理突发情况。
马克思其实用了很长的篇章讲过人的异化。但我们很少再提了。
在进化的路上,人和机器互相看了一眼,互相告别。