前阵子一直在想,当衣、食、住、行的需求满足到一定程度,我们其实不能吃得更多,也不能穿得更多,但有一样东西肯定会越用越多,就是电,尤其是随着高度自动化和智能化的发展,我们对能源的需求只会增加,不会减少。
后面又看到网上介绍一些十分好用的视频编辑工具,准备就智能技术写点分析,不过,还没构思好结构,Sora又出来了。
有朋友说,世界变化很快,我们要学会用AI。
不过,AI本就是为了让人更好的偷懒,现在已经不是人学着怎么用机器,而是机器在学习人的语言,文字,学着怎么像人一样思考,越来越变得,我只要能打字和说话就会用,感觉我们等着AI学好就行了,不用去学它。
除非我要去创造一个AI出来。
但是,我再怎么学,能造得出AI不呢?
应该是不能。
所以,还是不学了吧。还是讨论点人文角度的问题吧。比如, Sora,乃至ChatGPT能带来生产率的大幅提升吗?Sora会颠覆我们的工作和生活吗?中国在AI领域的差距越来越大了吗?诸如此类。
第一个问题,Sora,乃至ChatGPT能带来生产率的大幅提升吗?
我们所熟悉的现代生活只有100来年历史,这个我们很多人都有亲身感受。
每当有朋友说起现在如何不好,未来更不乐观,我就问,那你愿意回到古代吗?
别说古代,哪怕回到三、四十年前,我们可能都不会习惯。那时候交通基本靠走,空调是高档奢侈品,家里隔三差五要停电,要么是拉闸限电,要么是保险丝烧了。邻居的老大爷每每在院子里扯着嗓子喊:“装了空调的不要随便开啦,要去办线路增容啦,不然就会烧保险丝啦。”
想来也是很有意思。
农业社会中,生产率的提高十分缓慢,人们的生活变化不大。如果一个古人穿越,从清朝往以前直到周朝,来回都很容易适应,但如果穿越到现代,估计他会被惊吓到,因为完全不一样了。
据经济学家研究,我们认为是奇迹的现代科技,比如计算机、互联网及相关信息技术,并没有带来生产率的大幅提升和经济的重大发展。
经济的大跃进,主要发生在20世纪20至70年代。当时,第一次工业革命接近尾声,电力的普及和内燃机的发明,使得机器得以广泛使用,从而带来了生产率的跃迁。
农业社会,一个农民大概可耕种2-3亩地,一个专职纺布的熟练女工一天大概可纺一米布。
据记载,宋代的自耕农家庭可耕种30亩耕地,其中约24亩种粮,3亩种麻,3亩种桑,约可产粮食36石(一石为120斤),麻布9匹,绢帛13匹。
所以,在农业社会,一个人劳作的产出,只可养活少量的几个人。
而到工业社会,一个农民在机器的帮助下可耕种上千亩土地,一台纺织机械一天可纺布数千米。
这个时候,生产率提升了成百上千倍,一个人劳作的产出,可养活成百上千人。
这样,释放出来的劳动力可大量开展文化创作和技术创新,因而带来了社会生活方方面面的变革。
生产率的提升,也带来了经济发展的黄金时代。这一时期,欧美国家的经济增长非常快。
而到了20世纪70年代之后,其经济增长都逐渐放缓,但这一时期,却正是计算机、互联网和信息技术高速发展的时期。
为什么会这样?
那可能是如我们自身所感受的,借助电脑和互联网,我们可以把工作干得更好,通讯和联系更便利,却不能使我们的效率成倍的提升,一个人干不出成百上千人的活。
记得以前公司实施ERP,我们算投入产出,分析了半天,得出的结论是,如果将公司流程纳入系统管理,并不见得能节省人员,甚至还可能要增加人手,因为数据处理和录入的工作量将会增加。
电脑之后出现了手机,我们获得了通信、娱乐和资讯的极大便利,每个人籍手机消磨大量时光,个个成为知晓天下事的灵通博学之士,但也并未让我们能干出几个人的活。
所以,我们是否可以得出这样的结论:经济的跃进有赖于生产率的跃迁,而生产率的跃迁在于某项技术的出现,使得我们能以一当十,当百,甚至当千?
现在,ChatGPT、Sora的出现让我们惊叹,AI智能如斯,世界要变了。
但是,它会不会带来生产率的大幅提升?
在可见的当下,应该是不能,比如我们可以用ChatGPT对话,搜索答案,处理信息,但是它代替不了我们的工作;我们可以用AI生产视频、音频,但是视频、音频的架构、文本和创意,还是得我们自己绞尽脑汁。
不过,有位管理顾问预言,未来的工厂“只有一个人,一条狗”,“人是要喂狗,狗是要看住人,不让他碰机器”,那时候,可能就是人工智能的奇点时刻,工厂的生产彻底不需要人了。
我们在以前的文章中讨论过,生产率主要受两个因素影响,一个是动力,二个是知识,且前者更为关键。
生产率的第一次跃迁,是由于电和内燃机的发明带来了动力的变化。农业时代,能源主要就是烧柴火,动力靠人力,以及马拉车、牛耕田;之后的工业时代,我们需要用煤和石油,才好驱动机器。
而当人工智能把整个社会变成了一架万物互联的机器,人类不需要从事生产了,那么,我们可能需要能量密度更高的能源方式。
前阵,马斯克说,“You need transformers to run transformers”(前一个transformer指变压器,后一个transformer指人工智能模型),马斯克还预测,接下来将陷入短缺的是电力。
据报道,ChatGPT每天要响应大约2亿个请求,这个过程要消耗50万度电。
英伟达的H100型GPU,其功耗峰值为700瓦,A100为400瓦,新出的B200为1000瓦,高过很多家用电器,关键是,它们一般需要全天候运行。有推算称,到2024年底,将有350万块H100芯片被部署,一年的总耗电量将达到1.3万吉瓦时 (GWh),相当于中国一个中型城市的耗电量。
前阵网络炒得沸沸扬扬,山姆·奥特曼宣称要启动“造芯”计划,筹集7万亿美元生产芯片,以支撑 OpenAI 技术发展所需要的算力。黄仁勋则表示,如果你认为计算机无法发展得更快,可能会得出这样的结论:我们需要14颗行星、3个星系和4个太阳来为这一切提供燃料。
果然,他的B200功效提高了25倍,发展还是挺快的。
这是算力带来的电力消耗,更大的消耗应该还在于机械的全面自动化。就像我们一个人,思考一天总不如做一天体力活的消耗更大,是吧?
再一个是,过去我们都讲究节约用电,关机就要拔插头,但如果远程控制,总不好先跑过去插插头吧。
所以,智能时代,电应该变成一个可以随意使用的东西。
那么,预期未来,动力的耗用将越来越增加,生产率的提升,将带来动力的变革,而动力的变革,又可能促进生产率的跃迁。
所以,电力和新能源,还大有发展,不过,这也没什么问题,这些都是我们的优势领域。
而另一方面,Sora和ChatGPT还在发展的路上,短时内,或者单独的两个模型,应该是带不来生产率的大幅提升。
第二个问题,Sora会颠覆我们的工作和生活吗?
尤瓦尔·赫拉利在《人类简史》中说,不是人驯服了小麦,是小麦驯服了人。因为自从开始种小麦,人就要成天在地里劳作,并且终日忧郁地看天气,希望有好收成。
但是农耕种植使得人类能够定居,人口基数扩大,并且富余的粮食使得部分人开始从事政治、文学、艺术等,国家开始诞生。
而到了工业时代,生产率得到成百上千倍的提升,生产者的人数更少,劳动时间更短,社会进入一个消费时代,人们的衣、食、住、行发生全面变革。
就是说,当人们解决了温饱问题和基本需求,就只有一方面通过文化等调动人们的消费欲望,另一方面通过薪酬、福利制度的改革,让人们有钱消费,消耗掉生产出来的大量产品。
而如果生产力再次大幅提升,甚至全面实现自动化和智能化,那么人作为生产者的效用就会越来越弱化,甚至消失,而作为消费者的效用将需要强化。
试想,当机器写的咏叹调比巴赫更像巴赫,那总是需要人来欣赏的吧,机器是无所谓巴赫还是贝多芬的,都是算法而已,只有人类才会去区分。
机器也不需要食物,不需要保暖,不需要时尚,只需要充电。
机器进行生产,是因为人类有需求,所以,人类更大的效用在于消费。
而消费要么按需分配,要么需要货币购买,所以,未来,如何让生产效用越来越弱化的人有消费能力,越来越成为国家和社会需要解决的问题。
不过,经济学家们都在探讨债务端革命,货币政策,建设国内统一大市场,等等,相信未来应该有很多解决办法的。
2024龙年的央视春晚通过新媒体端向全球200个国家和地区的2100多家媒体进行直播和报道,创下了收视用户规模和收视次数的新纪录。
除了植入广告多,我个人对今年的春晚有三个印象:
一个是表演的人好多,分会场的节目看过去都是人山人海的感觉,一个相声都有9个人表演(“导演的心事”);
二个是有记忆点的节目不再局限于个别节目(比如往年的“千手观音”、“只此青绿”),从短片“我们的春晚”,到“创意年俗秀”,“年锦”,“山河诗长安”,“舞乐新疆”,“魔术”,“瓷影”,各有看点和话题点;
三个是美仑美焕,比如,人们常说费翔在87年春晚上唱的“冬天里的一把火”,导致万人空巷,我搜索了一下,大概就是费翔一个人在一个简陋的舞台且歌且舞,放到现在应该是难以有炸裂的效果。
现在的春晚在技术的加持下,个人英雄的效果似乎已不那么明显,节目的表现更依赖于组合创意,参与执导的导演也变多了,比如开场短片的导演是张大鹏,“创意年俗秀”出自张艺谋,“山河诗长安”结合了“长安三万里”的动画人物李白……
整体看来,哪怕是一个春晚,并没有因为技术的发展,而替代了人的作用,反而是因为技术的链接,需要更多人的合作,同时,由于技术的加持,扩大了人的表现力,让人们有不一样的发挥。
这其实就像微信、抖音等各种平台的涌现,使得普罗大众都可以在平台上进行创作,并且借助于文本和视频处理技术的进步,创作的难度降低,效果更好。
所以,现在Sora的出现,带来的可能只是人与人合作方式和工作模式的变化,应暂时达不到颠覆的效果,毕竟文生视频的效果,还在于文本的刻画,跟写个剧本是一样一样的。
记得以前公司拍宣传片,我搞了一阵,恍然大悟:懂了,片子拍得怎么样,关键在于这个解说文本,待我来好好写一写。
与制作公司讨论动画制作,他们说动画在于渲染,清晰度越高的动画要求画面帧数越多,一帧画面的渲染需要几分钟,一个人加班加点可制作20来秒的动画。
当时听了觉得,这实在是个体力活啊,怪不得成本这么高。这还是有电脑,如果没有,那岂不是要一帧一帧地手工画?
那么目前技术的发展,替代的还是这些体力活,背后的逻辑,还是回归到人文创作。
所以,大佬们都预测,AI时代,我们更需要的是人文、个性、做自己,可能将兴起新一波的文艺复兴。
很有道理。
比如,虽然机器写的曲子比巴赫更像巴赫,但是到底是要巴赫,还是贝多芬,还是有别于任一艺术家的某种风格?还在于人类自己。
只要人愿意,像那个杜尚,跑到商店买个便池签上名就说是艺术品,还成为了二十世纪最具争议和最有影响力的艺术品,一直被展出和收藏。
当AlphaGo击败李世石,人们非常恐慌,觉得机器彻底战胜了人类。但其实,人类本来在各方面就比不过机器。比如,跑得最快的人也跑不过汽车,但是这也不妨碍我们继续天天兴致盎然的跑短跑、长跑、马拉松,搞校运会、亚运会、奥运会各种比赛,还可以跟汽车结合起来,搞F1,拉力赛,飞驰人生……,只要你愿意,什么都可以,就看想怎么玩。
如此看来,AI的出现,可以让我们的生活更丰富多彩,玩法更多,不是吗?
第三个问题,中国在AI领域的差距越来越大了吗?
2023年7月7日,华为在一年一度的开发者大会上发布了盘古大模型。华为戏称:“盘古大模型不会写诗,只会做事”,意指ChatGPT能自动生成小作文。
华为的盘古大模型是一个“5+N+X”的三层架构,“5”是指包括自然语言、视觉、多模态、预测、科学计算的5个基础大模型,“N”对应各行业,华为云可以基于5个基础大模型,结合行业客户的自有数据,为客户训练自己的专有大模型;“X”则为客户提供更多细化场景的模型。
盘古大模型旨在服务千行百业,已在政务、金融、制造、医药研发、煤矿、铁路等行业发挥作用。
在煤矿领域,盘古“矿山”大模型已经在很多矿井使用,覆盖煤矿业务流程的1000多个细分场景,使得煤矿工人在地面上作业可以了。
以前,跟一个做矿山自动驾驶的朋友创业公司讨论业务,查看他们的竞争对手,发现矿山自动化这块,已经有很多公司在做,且很多环节都已经很成熟。
所以,不止是矿山,不止是华为,国内大量公司都在致力于实现各行各业的无人化:无人码头,无人工厂,无人检测,……
前面我们提到,下一个生产率的跃迁,应该是生产的全面自动化,把工厂变成“一个人,一条狗”的状态。在这个方向上,我们应该走得并不慢。
而发展这个方向,它其实不是“文成视频”、“生成式回答”那样的单点突破,更需要全流程的链接与打通,可能涉及大模型,可能涉及自动化机械,甚至可能是没有技术含量的流程链接,就像工业革命时期,科学管理也带来了生产率的大幅提升。
再看自动驾驶。
3月19日,华为问界开启新一轮OTA(空中下载技术)升级,其无图城区NCA领航功能,可实现全国99%道路的无图智能驾驶,全国的高速、高架、快速路,大小城市乃至乡镇的城区道路都能开启,做到“全国都能开,有路就能开”。
据业内评估,华为的智驾技术处于辅助驾驶级别中L2级向L3级过渡的阶段。(L1级是指定速巡航等,人可以“脱脚”;L级是指自动跟车、并线、泊车等,人可以有条件“脱手”;L3级是指在很多条件下可自动驾驶,人可以“脱眼”;L4级是指全条件的自动驾驶,人无需干预;L5级是指真正的无人驾驶)
目前特斯拉处在L2级别,因为国外公司一般主张从低别往上延伸,先主攻L2级,而国内公司则主张通过各方协同,先解决L3、L4的问题,再降维到L2。
这就带来了国、内外两种不同的风格,国外的公司倾向于把单车智能做到最佳,而国内的公司倾向于全局一盘棋,同时考虑车路协同、智能交通等多方配合的问题,实现全局最优。而靠着我们跨领域的整合能力,目前也已有很多部署。
无人驾驶方面,我们走得也不慢,甚至是领先。
国内大模型的发展如何呢?
2024年3月,国产大模型kimi智能助手进行了重大技术升级,可处理200万字的长文本,是GPT-4.5Turbo的10倍,在办公、医疗、保险、电商、教育、政法等领域都有刚性的应用需求和场景,很多网友都称十分好用。
Kimi智能助手的开发者,月之暗面(Moonshot AI)是国内目前估值最高的大模型公司,它的创建者杨植麟是在AGI方面具有较深背景和技术号召力的AI科学家。杨植麟认为AI不是他在接下来一两年找到PMF(产品/市场契合),而是接下来十到二十年如何改变世界,追赶GPT会是必由之路,但国内的模型应可做出某些维度世界领先的能力,出现用户量级更大的产品。
Sora刚出来时,很多人说,我们的差距不是缩小,而是扩大了;为什么Sora没有出现在中国。我感觉,这也不是个大问题,没有出现Sora,我们可能出现了一些别的。再说,本来美国就擅长原发性创新,我们擅长应用性创新,先前的自动驾驶我们应该也不是先发者,现在却有领先的势头。
以前看电影《头号玩家》,里面现实世界一片废墟,虚拟世界却欣欣向荣。现在想来,这种场景在生产制造的中国应该不可能出现,如果把无人矿山、无人生产、无人驾驶都搞了,现实世界总不会萧条。
现实世界的工作是大多需要实实在在的搬砖。所以,要打通数字世界与物理世界,不止是数据,还必须解决好搬砖的问题。而解决搬砖的问题,我们正在进行。
大家都喜欢引用罗曼·罗兰的话:真正的英雄主义是在认清生活的真相后依然热爱生活。我却觉得,只有认清了生活的本质,才能热爱生活。比如,如果没有认清,不了解,会疑虑恐慌,觉得这个问题很大。认清了解了才会觉得,哦,这很正常,这是这么个东西,没什么大不了的。
对AI也是这样。