【第三重境】有了Sora的世界会怎样？

文摘财经 2024-03-23 10:12 湖南

前阵子一直在想，当衣、食、住、行的需求满足到一定程度，我们其实不能吃得更多，也不能穿得更多，但有一样东西肯定会越用越多，就是电，尤其是随着高度自动化和智能化的发展，我们对能源的需求只会增加，不会减少。

后面又看到网上介绍一些十分好用的视频编辑工具，准备就智能技术写点分析，不过，还没构思好结构，Sora又出来了。

有朋友说，世界变化很快，我们要学会用AI。

不过，AI本就是为了让人更好的偷懒，现在已经不是人学着怎么用机器，而是机器在学习人的语言，文字，学着怎么像人一样思考，越来越变得，我只要能打字和说话就会用，感觉我们等着AI学好就行了，不用去学它。

除非我要去创造一个AI出来。

但是，我再怎么学，能造得出AI不呢？

应该是不能。

所以，还是不学了吧。还是讨论点人文角度的问题吧。比如， Sora，乃至ChatGPT能带来生产率的大幅提升吗？Sora会颠覆我们的工作和生活吗？中国在AI领域的差距越来越大了吗？诸如此类。

第一个问题，Sora，乃至ChatGPT能带来生产率的大幅提升吗？

我们所熟悉的现代生活只有100来年历史，这个我们很多人都有亲身感受。

每当有朋友说起现在如何不好，未来更不乐观，我就问，那你愿意回到古代吗？

别说古代，哪怕回到三、四十年前，我们可能都不会习惯。那时候交通基本靠走，空调是高档奢侈品，家里隔三差五要停电，要么是拉闸限电，要么是保险丝烧了。邻居的老大爷每每在院子里扯着嗓子喊：“装了空调的不要随便开啦，要去办线路增容啦，不然就会烧保险丝啦。”

想来也是很有意思。

农业社会中，生产率的提高十分缓慢，人们的生活变化不大。如果一个古人穿越，从清朝往以前直到周朝，来回都很容易适应，但如果穿越到现代，估计他会被惊吓到，因为完全不一样了。

据经济学家研究，我们认为是奇迹的现代科技，比如计算机、互联网及相关信息技术，并没有带来生产率的大幅提升和经济的重大发展。

经济的大跃进，主要发生在20世纪20至70年代。当时，第一次工业革命接近尾声，电力的普及和内燃机的发明，使得机器得以广泛使用，从而带来了生产率的跃迁。

农业社会，一个农民大概可耕种2-3亩地，一个专职纺布的熟练女工一天大概可纺一米布。

据记载，宋代的自耕农家庭可耕种30亩耕地，其中约24亩种粮，3亩种麻，3亩种桑，约可产粮食36石（一石为120斤），麻布9匹，绢帛13匹。

所以，在农业社会，一个人劳作的产出，只可养活少量的几个人。

而到工业社会，一个农民在机器的帮助下可耕种上千亩土地，一台纺织机械一天可纺布数千米。

这个时候，生产率提升了成百上千倍，一个人劳作的产出，可养活成百上千人。

这样，释放出来的劳动力可大量开展文化创作和技术创新，因而带来了社会生活方方面面的变革。

生产率的提升，也带来了经济发展的黄金时代。这一时期，欧美国家的经济增长非常快。

而到了20世纪70年代之后，其经济增长都逐渐放缓，但这一时期，却正是计算机、互联网和信息技术高速发展的时期。

为什么会这样？

那可能是如我们自身所感受的，借助电脑和互联网，我们可以把工作干得更好，通讯和联系更便利，却不能使我们的效率成倍的提升，一个人干不出成百上千人的活。

记得以前公司实施ERP，我们算投入产出，分析了半天，得出的结论是，如果将公司流程纳入系统管理，并不见得能节省人员，甚至还可能要增加人手，因为数据处理和录入的工作量将会增加。

电脑之后出现了手机，我们获得了通信、娱乐和资讯的极大便利，每个人籍手机消磨大量时光，个个成为知晓天下事的灵通博学之士，但也并未让我们能干出几个人的活。

所以，我们是否可以得出这样的结论：经济的跃进有赖于生产率的跃迁，而生产率的跃迁在于某项技术的出现，使得我们能以一当十，当百，甚至当千？

现在，ChatGPT、Sora的出现让我们惊叹，AI智能如斯，世界要变了。

但是，它会不会带来生产率的大幅提升？

在可见的当下，应该是不能，比如我们可以用ChatGPT对话，搜索答案，处理信息，但是它代替不了我们的工作；我们可以用AI生产视频、音频，但是视频、音频的架构、文本和创意，还是得我们自己绞尽脑汁。

不过，有位管理顾问预言，未来的工厂“只有一个人，一条狗”，“人是要喂狗，狗是要看住人，不让他碰机器”，那时候，可能就是人工智能的奇点时刻，工厂的生产彻底不需要人了。

我们在以前的文章中讨论过，生产率主要受两个因素影响，一个是动力，二个是知识，且前者更为关键。

生产率的第一次跃迁，是由于电和内燃机的发明带来了动力的变化。农业时代，能源主要就是烧柴火，动力靠人力，以及马拉车、牛耕田；之后的工业时代，我们需要用煤和石油，才好驱动机器。

而当人工智能把整个社会变成了一架万物互联的机器，人类不需要从事生产了，那么，我们可能需要能量密度更高的能源方式。

前阵，马斯克说，“You need transformers to run transformers”（前一个transformer指变压器，后一个transformer指人工智能模型），马斯克还预测，接下来将陷入短缺的是电力。

据报道，ChatGPT每天要响应大约2亿个请求，这个过程要消耗50万度电。

英伟达的H100型GPU，其功耗峰值为700瓦，A100为400瓦，新出的B200为1000瓦，高过很多家用电器，关键是，它们一般需要全天候运行。有推算称，到2024年底，将有350万块H100芯片被部署，一年的总耗电量将达到1.3万吉瓦时 (GWh)，相当于中国一个中型城市的耗电量。

前阵网络炒得沸沸扬扬，山姆·奥特曼宣称要启动“造芯”计划，筹集7万亿美元生产芯片，以支撑 OpenAI 技术发展所需要的算力。黄仁勋则表示，如果你认为计算机无法发展得更快，可能会得出这样的结论：我们需要14颗行星、3个星系和4个太阳来为这一切提供燃料。

果然，他的B200功效提高了25倍，发展还是挺快的。

这是算力带来的电力消耗，更大的消耗应该还在于机械的全面自动化。就像我们一个人，思考一天总不如做一天体力活的消耗更大，是吧？

再一个是，过去我们都讲究节约用电，关机就要拔插头，但如果远程控制，总不好先跑过去插插头吧。

所以，智能时代，电应该变成一个可以随意使用的东西。

那么，预期未来，动力的耗用将越来越增加，生产率的提升，将带来动力的变革，而动力的变革，又可能促进生产率的跃迁。

所以，电力和新能源，还大有发展，不过，这也没什么问题，这些都是我们的优势领域。

而另一方面，Sora和ChatGPT还在发展的路上，短时内，或者单独的两个模型，应该是带不来生产率的大幅提升。

第二个问题，Sora会颠覆我们的工作和生活吗？

尤瓦尔·赫拉利在《人类简史》中说，不是人驯服了小麦，是小麦驯服了人。因为自从开始种小麦，人就要成天在地里劳作，并且终日忧郁地看天气，希望有好收成。

但是农耕种植使得人类能够定居，人口基数扩大，并且富余的粮食使得部分人开始从事政治、文学、艺术等，国家开始诞生。

而到了工业时代，生产率得到成百上千倍的提升，生产者的人数更少，劳动时间更短，社会进入一个消费时代，人们的衣、食、住、行发生全面变革。

就是说，当人们解决了温饱问题和基本需求，就只有一方面通过文化等调动人们的消费欲望，另一方面通过薪酬、福利制度的改革，让人们有钱消费，消耗掉生产出来的大量产品。

而如果生产力再次大幅提升，甚至全面实现自动化和智能化，那么人作为生产者的效用就会越来越弱化，甚至消失，而作为消费者的效用将需要强化。

试想，当机器写的咏叹调比巴赫更像巴赫，那总是需要人来欣赏的吧，机器是无所谓巴赫还是贝多芬的，都是算法而已，只有人类才会去区分。

机器也不需要食物，不需要保暖，不需要时尚，只需要充电。

机器进行生产，是因为人类有需求，所以，人类更大的效用在于消费。

而消费要么按需分配，要么需要货币购买，所以，未来，如何让生产效用越来越弱化的人有消费能力，越来越成为国家和社会需要解决的问题。

不过，经济学家们都在探讨债务端革命，货币政策，建设国内统一大市场，等等，相信未来应该有很多解决办法的。

2024龙年的央视春晚通过新媒体端向全球200个国家和地区的2100多家媒体进行直播和报道，创下了收视用户规模和收视次数的新纪录。

除了植入广告多，我个人对今年的春晚有三个印象：

一个是表演的人好多，分会场的节目看过去都是人山人海的感觉，一个相声都有9个人表演（“导演的心事”）；

二个是有记忆点的节目不再局限于个别节目（比如往年的“千手观音”、“只此青绿”），从短片“我们的春晚”，到“创意年俗秀”，“年锦”，“山河诗长安”，“舞乐新疆”，“魔术”，“瓷影”，各有看点和话题点；

三个是美仑美焕，比如，人们常说费翔在87年春晚上唱的“冬天里的一把火”，导致万人空巷，我搜索了一下，大概就是费翔一个人在一个简陋的舞台且歌且舞，放到现在应该是难以有炸裂的效果。

现在的春晚在技术的加持下，个人英雄的效果似乎已不那么明显，节目的表现更依赖于组合创意，参与执导的导演也变多了，比如开场短片的导演是张大鹏，“创意年俗秀”出自张艺谋，“山河诗长安”结合了“长安三万里”的动画人物李白……

整体看来，哪怕是一个春晚，并没有因为技术的发展，而替代了人的作用，反而是因为技术的链接，需要更多人的合作，同时，由于技术的加持，扩大了人的表现力，让人们有不一样的发挥。

这其实就像微信、抖音等各种平台的涌现，使得普罗大众都可以在平台上进行创作，并且借助于文本和视频处理技术的进步，创作的难度降低，效果更好。

所以，现在Sora的出现，带来的可能只是人与人合作方式和工作模式的变化，应暂时达不到颠覆的效果，毕竟文生视频的效果，还在于文本的刻画，跟写个剧本是一样一样的。

记得以前公司拍宣传片，我搞了一阵，恍然大悟：懂了，片子拍得怎么样，关键在于这个解说文本，待我来好好写一写。

与制作公司讨论动画制作，他们说动画在于渲染，清晰度越高的动画要求画面帧数越多，一帧画面的渲染需要几分钟，一个人加班加点可制作20来秒的动画。

当时听了觉得，这实在是个体力活啊，怪不得成本这么高。这还是有电脑，如果没有，那岂不是要一帧一帧地手工画？

那么目前技术的发展，替代的还是这些体力活，背后的逻辑，还是回归到人文创作。

所以，大佬们都预测，AI时代，我们更需要的是人文、个性、做自己，可能将兴起新一波的文艺复兴。

很有道理。

比如，虽然机器写的曲子比巴赫更像巴赫，但是到底是要巴赫，还是贝多芬，还是有别于任一艺术家的某种风格？还在于人类自己。

只要人愿意，像那个杜尚，跑到商店买个便池签上名就说是艺术品，还成为了二十世纪最具争议和最有影响力的艺术品，一直被展出和收藏。

当AlphaGo击败李世石，人们非常恐慌，觉得机器彻底战胜了人类。但其实，人类本来在各方面就比不过机器。比如，跑得最快的人也跑不过汽车，但是这也不妨碍我们继续天天兴致盎然的跑短跑、长跑、马拉松，搞校运会、亚运会、奥运会各种比赛，还可以跟汽车结合起来，搞F1，拉力赛，飞驰人生……，只要你愿意，什么都可以，就看想怎么玩。

如此看来，AI的出现，可以让我们的生活更丰富多彩，玩法更多，不是吗？

第三个问题，中国在AI领域的差距越来越大了吗？

2023年7月7日，华为在一年一度的开发者大会上发布了盘古大模型。华为戏称：“盘古大模型不会写诗，只会做事”，意指ChatGPT能自动生成小作文。

华为的盘古大模型是一个“5+N+X”的三层架构，“5”是指包括自然语言、视觉、多模态、预测、科学计算的5个基础大模型，“N”对应各行业，华为云可以基于5个基础大模型，结合行业客户的自有数据，为客户训练自己的专有大模型；“X”则为客户提供更多细化场景的模型。

盘古大模型旨在服务千行百业，已在政务、金融、制造、医药研发、煤矿、铁路等行业发挥作用。

在煤矿领域，盘古“矿山”大模型已经在很多矿井使用，覆盖煤矿业务流程的1000多个细分场景，使得煤矿工人在地面上作业可以了。

以前，跟一个做矿山自动驾驶的朋友创业公司讨论业务，查看他们的竞争对手，发现矿山自动化这块，已经有很多公司在做，且很多环节都已经很成熟。

所以，不止是矿山，不止是华为，国内大量公司都在致力于实现各行各业的无人化：无人码头，无人工厂，无人检测，……

前面我们提到，下一个生产率的跃迁，应该是生产的全面自动化，把工厂变成“一个人，一条狗”的状态。在这个方向上，我们应该走得并不慢。

而发展这个方向，它其实不是“文成视频”、“生成式回答”那样的单点突破，更需要全流程的链接与打通，可能涉及大模型，可能涉及自动化机械，甚至可能是没有技术含量的流程链接，就像工业革命时期，科学管理也带来了生产率的大幅提升。

再看自动驾驶。

3月19日，华为问界开启新一轮OTA（空中下载技术）升级，其无图城区NCA领航功能，可实现全国99%道路的无图智能驾驶，全国的高速、高架、快速路，大小城市乃至乡镇的城区道路都能开启，做到“全国都能开，有路就能开”。

据业内评估，华为的智驾技术处于辅助驾驶级别中L2级向L3级过渡的阶段。（L1级是指定速巡航等，人可以“脱脚”；L级是指自动跟车、并线、泊车等，人可以有条件“脱手”；L3级是指在很多条件下可自动驾驶，人可以“脱眼”；L4级是指全条件的自动驾驶，人无需干预；L5级是指真正的无人驾驶）

目前特斯拉处在L2级别，因为国外公司一般主张从低别往上延伸，先主攻L2级，而国内公司则主张通过各方协同，先解决L3、L4的问题，再降维到L2。

这就带来了国、内外两种不同的风格，国外的公司倾向于把单车智能做到最佳，而国内的公司倾向于全局一盘棋，同时考虑车路协同、智能交通等多方配合的问题，实现全局最优。而靠着我们跨领域的整合能力，目前也已有很多部署。

无人驾驶方面，我们走得也不慢，甚至是领先。

国内大模型的发展如何呢？

2024年3月，国产大模型kimi智能助手进行了重大技术升级，可处理200万字的长文本，是GPT-4.5Turbo的10倍，在办公、医疗、保险、电商、教育、政法等领域都有刚性的应用需求和场景，很多网友都称十分好用。

Kimi智能助手的开发者，月之暗面（Moonshot AI）是国内目前估值最高的大模型公司，它的创建者杨植麟是在AGI方面具有较深背景和技术号召力的AI科学家。杨植麟认为AI不是他在接下来一两年找到PMF（产品/市场契合），而是接下来十到二十年如何改变世界，追赶GPT会是必由之路，但国内的模型应可做出某些维度世界领先的能力，出现用户量级更大的产品。

Sora刚出来时，很多人说，我们的差距不是缩小，而是扩大了；为什么Sora没有出现在中国。我感觉，这也不是个大问题，没有出现Sora，我们可能出现了一些别的。再说，本来美国就擅长原发性创新，我们擅长应用性创新，先前的自动驾驶我们应该也不是先发者，现在却有领先的势头。

以前看电影《头号玩家》，里面现实世界一片废墟，虚拟世界却欣欣向荣。现在想来，这种场景在生产制造的中国应该不可能出现，如果把无人矿山、无人生产、无人驾驶都搞了，现实世界总不会萧条。

现实世界的工作是大多需要实实在在的搬砖。所以，要打通数字世界与物理世界，不止是数据，还必须解决好搬砖的问题。而解决搬砖的问题，我们正在进行。

大家都喜欢引用罗曼·罗兰的话：真正的英雄主义是在认清生活的真相后依然热爱生活。我却觉得，只有认清了生活的本质，才能热爱生活。比如，如果没有认清，不了解，会疑虑恐慌，觉得这个问题很大。认清了解了才会觉得，哦，这很正常，这是这么个东西，没什么大不了的。

对AI也是这样。‍‍

http://mp.weixin.qq.com/s?__biz=MzU2Mzg3NTAyNw==&mid=2247484735&idx=1&sn=0c5994ccc4f976561d2ac5fb79c27b13

第三重境

洞察·获得·价值寻优