除了聊天,AI改变世界了吗

科技   2024-09-28 00:02   江苏  

工作日的早上,你正堵在某个城市的环线上。往前看是一望无际的车流。再过 20 分钟,你必须出现在公司的大门口。

这个时候,你是不是特别希望能够飞上天,看看前面到底发生了什么?是什么制造了这条长龙?

如果你真的能飞上天,一定会发现,在遥远的堵车的开头,可能什么都没有发生,车队就像遇到了空气墙,挤在一起。

但是拥堵的前方一马平川,真的是鬼都没有。这种现象被称为幽灵堵车。2008 年,日本名古屋大学曾经做过一个实验。他们让 22 辆汽车以每小时 30 千米的速度,绕一个 230 米长的大圈匀速行驶。

结果发现,一开始汽车还能保持间距正常的移动,但很快,一些汽车之间的间距开始变小。

当有的车为了避免追尾,开始减速的时候,拥堵出现了。在一个没有任何障碍的圆圈型公路上,神奇的堵车现象出现了。

产生这种现象的原因是什么呢?

一直以来,科学家试图从数学角度,解释幽灵堵车现象。

2013 年,麻省理工的科学家贝特霍尔德·霍恩,在 IEEE 智能交通系统年会上,发表了一篇论文,提出了自己的数学模型和解决方案。在论文中,霍恩用两种数学模型,解释了幽灵堵车现象为什么会出现。简单来说,当汽车在马路上行驶时,每个人都会试图和前面的车,保持一定的距离,来确保不会追尾。

在一般情况下,这个安全距离足够长,不会彼此影响。但是当车辆密度逐渐增大,安全距离变小时,前面刹车就会干扰到后面的司机。

为了避免追尾,你一定也会踩一下刹车。这个时候,就算前面的司机马上一脚油门,扬长而去了,你已经做出的刹车行为,还是会影响到后面的人。现在你把汽车想象成一个例子,整个马路上的车就形成了一个车流。这个刹车的行为就像一个波的震荡,必然会在流体中向后传播。

在正常的流体中,这个波会逐渐消失掉,因为波的能量会在传播中,逐渐消散到周围的环境中。

但车流不一样,在波的传递过程中,每个司机开车的习惯不同,总有人会更用力地踩刹车,这样波动就会变大,直到有一辆汽车停下来,于是堵车就产生了。所以解决方案是什么呢?其实很简单,每个车,只需要保持和前后统一的间距,就可以了。你想象,所有的车都在相同的间距下统一行动,波动就消失了。

在这种情况下,波动的能量,就会均匀的扩散到整个车流中,而不会出现明显的波动,于是拥堵就消失了。这种解决方案被霍恩称为双边控制。2017 年,霍恩发表了自己的波动方程。在这个图上,横轴代表空间的移动,纵轴代表时间,斜着的线是汽车的视界线。汽车在一个小时的时间中,向前行驶了 100 公里,在这张图上就是这个样子。

现在我们换一张图,在这张图中,每条线都代表一辆汽车,整张图就代表一段马路上所有的汽车。在传统的跟车模式下,某一辆汽车突然变道插入在车流中,引起了微小的波动。这个波动随着时间向后放大,最后很多汽车的世界线挤到一起了,这说明产生了很严重的拥堵。

但是第二张图使用了双边控制策略,于是汽车的插入,只是引起了非常微小的一点波动,就被整个车流消化掉了。当然在现实中,我们不可能要求每一个司机,在开车的同时,还能随时控制前后的车距。所以霍恩建议汽车制造商,在自动跟车和巡航模式之上,增加双边控制,可以根据实际情况进行切换。

在车流密度达到一定程度时,切换双边控制,这样就可以解决大部分拥堵问题了。这个设想太理想了。现实中可能会引起很多新问题。

你想想,万一你后面有一辆不执行策略的车,又菜又爱玩,老喜欢往人家车屁股上凑,那你不就被这辆车,给顶到前面车屁股上了。

所以要彻底消除幽灵堵车的现象,恐怕还得等到全民自动驾驶的时代。在未来全民自动驾驶的时代,不光所有的车都可以执行相同的策略,在车联网下,甚至所有的车都可以在一个系统下,统一行动。

这意味着,系统会自动调配每辆车的车速,确保所有的车互不干扰,连路口的红绿灯都可以下岗了。但现在距离那一天还很遥远,要改善拥堵,我们只能想别的办法。造成幽灵堵车的原因有很多,前车司机刹车、变道、超车、道路变窄、鬼探头、红绿灯等等,都会因为幽灵堵车而放大,最后变成大拥堵。

而城市和道路规划不合理,车流密度过大等等也是重要的原因。所以要解决拥堵问题,当然得从各个方面想办法。但从目前来看,有效的改善路口的红绿灯,无疑是最快捷有效的办法。

传统上,我们采用固定时间来切换红绿灯,这种红绿灯管理方式的缺点,是很明显的。甚至很多时候,他们就是造成城市拥堵的最重要原因。所以为了改善这种情况,后来就出现了专家系统。什么是专家系统呢?

就是交通专家根据经验,来配置一些红绿灯策略。比如某个路口某个方向上的车很多了,已经超过了某一个预值,那就延长这个方向的绿灯时间。

如何知道每个方向上的车辆数量呢?

其实也很简单,我们可以在道路上,埋设一些地磁感应装置,汽车开过去,就会记录下一些汽车的数据,然后再根据这些数据计算车流密度、移动速度等,使用专家预设的固定算法算出结果,超过某一预值就启动某一个策略。但是固定的策略,很难应对千变万化的交通状况。

一个城市地图,是由非常多的城市路口组成的,而不同路口之间的车流是互相影响的。举个最简单的例子,前面已经提到了,车辆密度,也是影响交通拥堵的最重要原因。

当车辆密度很大时,车流中一个轻微的刹车,就可能造成后面的拥堵。所以如果一个路口车流密度很大,那么提前几个路口就通过红绿灯,适当的限流,也是缓解和避免拥堵的有效办法。所以从这个角度来说,在这张巨大的城市地图上,互相影响的不同路口,其实就像围棋的棋子,而整个城市的红绿灯控制,就变成了一个围棋问题。

不同的是,围棋只有 357 个落子点,并且讲究落子无悔,这意味着,我们只需要考虑,每一步芯子对整个系统造成的影响,就可以了。

但是一个城市,根据《中国重点城市道路网结构画像报告》提供的数据,每 327 米就会有一个交叉路口。

这意味着,一个大城市,会有上万甚至几万个交叉路口,而每时每刻,每个路口的交通状况都在产生变化。

全盘考虑这样一个系统,并且在这个系统中,寻找一个实时控制的最优解,这已经完全不是,一个固定策略的专家系统,能够搞定的了。怎么办呢?有个相对简单的改进方案,叫做绿波方案。

你如果经常开车使用导航,可能会听到导航说这样一句话:“您已进入绿波路段,保持现在的车速,可以连续通过两个红绿灯。”这就是绿波方案。

说白了,他会考虑到红绿灯之间的联动,通过计算平均车速,来控制相邻的红绿灯的开关,让车能够通过尽可能多的红绿灯。当然如果你经常开车,也就会知道,这个策略也是经常会不奏效的。

为啥呢?

因为很多时候,你可能开不到绿波设计的理想车速,前面有卧龙凤雏,可能正在保电话粥,或者有一大堆车正在排队拐弯。

然后,你的绿波路段就变成了红波路段了。所以这种只看几个红绿灯的策略,在复杂的交通问题上,也很难取得非常好的效果。到这里你可能已经想到了,解决这种复杂的系统问题,只能请出 AI 来了。毕竟在围棋问题上使用强化学习,早在 2016 年 AI 就已经吊打人类选手了。

但就像前面说的那样,交通问题远比围棋问题要复杂的多,它不仅每时每刻都在发生着变化,所涉及的变化要素也要多得多。

路口和红绿灯只是其中之一,从路口拓展开去,线路规划、拓扑结构、交通管控、不同车辆、人、环境,所有的因素交织在一起,构成了一个非常巨大,非常复杂的时空网络。

试图单纯关注一点,单纯从空间,或者时间角度去理解交通状况,都是无法准确把握交通行为的。这可能也是为什么大模型出现以后,很多冠以 ST 的交通大模型,扎堆出现的原因。special 代表空间, temporal 代表时间。当 AI 从整个时空序列,去理解交通的时候,才有可能真正的学到点什么。经常使用ChatGPT的朋友们,应该会知道,ChatGPT 在理解时序上是没有问题的。

因为它们能够从前面的词语中,预测下一个出现的词。你把词语理解成在时间线上,发生的一个个事件,这意味着大模型可以从过去预知未来。

所以我们只需要把空间和拓扑结构,同样嵌入到 TOKEN 中去,进行训练,就可以让大模型理解时间了。那么交通大模型们做的怎么样呢?

学院派的成果有很多,比如东南大学的 MT GPT,北京交通大学的 transGPT 等,咱们就不展开了。

毕竟 ChatGPT 出现已经快 2 年了,对 Transformer 做改造,引入时空概念,然后找一些公开数据做训练,跑一个结果出来的学院派做法,虽然也在很多细分领域,带来了很多创新,但显然大家更关心的是,这一系列的创新能不能真正的落地。

特别涉及到交通领域,我们更想知道,AI 到底能不能把我们从堵车问题中,拯救出来。贵阳是贵州的省会,截止 2024 年底,贵阳的机动车保有量为 234.8 万辆。

在联合百度智能云进行治理以后,工作日贵阳市观山湖区域,车均延误平均下降了 15%,高峰期拥堵减少了半个小时,巅峰期甚至可以不停车通过 8 - 10 个绿灯。这种连过 10 个红绿灯的爽快感,反正我是没有体验过。怎么做到的呢?答案就是 AI。

其实早在 2019 年,贵阳市就已经在考虑,使用传统的人工智能方法,进行交通治理了。

但真正的变化可能还是在 2023 年以后,通过落地 AI 全域信控,贵阳市观山湖区的交通信号管理,出现了根本的变化。

用相关部门的话来说,就是从车看灯变成了灯看车。熟悉AI的小伙伴肯定知道,看起来只是三个字的语序调整,但这里面涉及的技术难题,可就多了去了。首先,最大的难题就是数据一致性的问题。我们知道,大语言模型之所以出现质的飞跃,很大程度上归功于海量的有效数据。甚至 MIT 有人写了一篇论文,认为数据才是最重要的。

因为随着数据的增加,不同的神经网络表现出来的结果,最终将变得越来越趋同。总之一句话,谁能有巨量精准的交通数据,谁就能做出真正的交通大模型。在这方面,百度当然是有优势的。百度地图已经搞了多年,积累了大量真实的道路数据。而各种交通实时数据,贵阳市交通部门自然也不会缺。

所以更关键的是,怎样把这些数据统一到同一模型之下,变成 AI 可以统一理解的数据语言。对语言模型来说,这很简单,通过磁嵌入技术,统一将文字转化成 TOKEN 就可以了。

但是交通设计的数据就太庞杂了,有文本、有图像、有视频还有各种感应设备,获取的各类编码数据。

就是同样的摄像头,数据也有不同标准。你怎么能确定,3 个不同的摄像头的图像,对应的是同一辆车呢?所以首先要做的,就是所有数据时空上的对齐。就像我们的大脑,眼睛看到不同的光,耳朵听到不同的声音,鼻子闻到不同的味道,手机触到不同的感觉。

但在我们的大脑中,所有这一切外部刺激必须完成对齐,在我们的世界模型中,对应到同一个事物上,我们才能认识世界,做出反应。在贵阳的这个项目中,百度如何做到这一点呢?

从百度云智大会发布的,百度智能交通引擎 4.0 白皮书中,我们可以对百度的技术实现方式,窥探 一二。

交通数据是做好交通优化工作的基础,为了保证交通决策方案的合理性,和灵活性,一是要求交通数据全,二是要求交通数据准确。现在很多城市,没有办法在每一个路口,都建设检测设备,设备也会有因施工、断电、断网的时候。要保证数据的全而准,不仅要对缺失的数据进行补充,还要能够利用算法进行补全。

百度的做法是打造交通感知智能体,使用地图数据和外场数据进行互补,利用 GNN 图神经网络的算法,寻找区域不同节点之间的数据变化,规律补全数据。数据补全了,对齐了,AI 需要知道这些数据到底代表着什么。

这里面就是交通研判智能体,大展身手的时候了。AI 通过学习海量的交通知识,具备了很好的认知能力。

举个最简单的例子,比如看到车停下来,到底是违法停车、发生车祸,还是发生了交通拥堵,对未来短时间的交通状态,到底会有多大的影响。

通过百度交通大模型,异常的交通拥堵,常发或偶发交通堵点,产生交通拥堵的原因等等,这都是可以分析出来的。在分析出交通规律和交通发展趋势,以后就需要做针对性的解决方案了。

百度交通优化智能体,可以根据当前的情况,自动计算调整红绿灯的时间,建议是否要增加可变车道等措施。

在发现了交通事故以后,可以通过系统自动通知,或调动周边警力,快速处理交通事故,防止交通拥堵蔓延。利用百度的服务智能体,还可以实现与市民的信息互动。

前方路口的红灯还有几秒,开多少的速度可以不停车通过,前方多个路口等信息,都可以通过百度地图,触达到每一个出行者,增加了市民的获得感,提高了交通参与者的满意度。在百度的白皮书中,我们反复看到一个词“平行世界”。

这类似一种自我推理,意味着针对一个交通状况,AI 会给出不同的策略,然后根据不同的策略,预测出不同的交通状况,继续出策略,然后在所有的平行世界中,选择一个演化的最优解。

想一想,当你驾车通过一个十字路口时,在 AI 推理的世界中,代表你的项链,早已经在不同的平行世界里穿梭,是不是一件很好玩的事?所以你知道为了让你连过 10 个绿灯,AI 有多拼吗?

当然我们不得不说,一个交通大模型,不仅仅是红绿灯控制这种事情,这里面还涉及需要人为参与的事情。

这些事情,就需要 AI 大模型向工作人员反馈。在这种情况下,语言大模型和视觉大模型,就起到了关键的作用。比如交通事故,拥有认知能力的大模型,可以第一时间发现,然后调用语言大模型及时提示,并给出处理办法。在工作人员认可处理办法之后,还可以迅速通知相关人员,如交警、消防、工程,以最快速度做出响应。这,就是一个大模型管控下的交通现状了。当然任何一个大模型都超级复杂,本文能够提及的,仅仅是冰山一角。在普通人的感知里,最近半年关于 AI 的消息已经越来越少。

聊天、绘画、视频制作,这些当年惊为天人的突破,尘埃落定之后,我们相信,很多人脑子里的疑惑越来越多了。

除了卖课的和炒股的,AI 真的改变世界了吗?应该说这场由 Chat GPT 引发的 AI 变革,已经进入了下半场。

你之所以再也看不到激动人心的突破,可能不是因为审美疲劳,而是在 Transformer 一统天下的情况下,模型上的创新已经乏善可陈。

明眼人都知道,2023 年以后的大部分模型创新,无非是 Transformer 基础上的小修小补。虽然在模型创新层面,我们还有不小的差距,但显然,AI 的主战场早已经从模型转移到数据,然后从数据转移到算力,最后再由算力转移到行业落地。

这是我们的主场,而这一切并不能吸引流量,所以发生的悄无声息。当你驾车通过一个十字路口时,你一定不会想到,在一个遥远的数据中心,无数的显卡正在疯狂的运转,只为了让你尽可能的多看到一个绿灯。

从公开数据来看,国内市场,今年 1 - 8 月的大模型中标项目数量,已经达到了 476 个,是 2023 年全年总数的 5 倍。其中在各行业龙头的央国企市场中,百度的领先优势较为突出。没错,交通管理只是其中很小的一部分。港口、汽车、冶金、金融、电子、手机、能源、教育,在各个行业,百度智能云,都已经成功完成了很多商业落地。在港口行业,AI 帮助山东港口集团完成,内部知识库的建设。通过 AI,实现港口人机或船厂的高精度汇聚,提升了堆场利用率和堆场周转率。在汽车行业,AI 帮助汽车行业建立智能座舱、AI 助手和自动驾驶。在冶金行业,它帮助企业完成运营辅助决策,提升生产效率。在金融行业,他帮助金融行业完成智能风控,财报研读和内部知识库。在手机行业,实现手机大模型的训练,完成云端大模型的支持。在能源行业,建设 AI 分析底座,完成算力共享、知识共享、安全预警、事件共治。在教育行业,训练教育大模型,实现学习助手。而几乎在所有行业,构建知识库、提供算力平台、训练行业模型,都成为共同的需求。所以为什么百度可以,或者说为什么大家需要百度?难道不能自己搞?

因为从模型到数据到算力到落地,对于普通企业来说,在这不到两年的时间中,要跟上 AI 变化,要面临的难度越来越大。数据需要依赖长期的积累,算力不用说了,你懂的。

而落地则综合了前面所有的难题。对一个普通的企业来说,要引入 AI,至少需要以下几步:一、训练自己的模型。毕竟大量的行业知识,存在于自己的企业内部,通用大模型是无从知晓的。

所以要拥有好用的 AI,要么你把自己的行业知识,全部导入帅哥数据库,供通用大模型调用,要么你在通用大模型基础上,训练自己的模型。第二步,你需要清洗数据,需要算力平台。而算力平台绝不是你买到多少张显卡装到机房里就可以解决的问题。

大模型尺寸太大,一张显卡跑不起来,要进行有效的训练,你需要进行拆分,建立一个集群,把模型和数据拆分到很多显卡上,同时进行。

这工作没有十年如一日的在分布式计算领域的持续投入,是很难搞定的。更何况因为众所周知的原因,如果你要搭建一个千卡集群,你可能不能只使用英伟达的显卡,还会有各种国内厂商的 AI 芯片。

把各种显卡都搞到一起,还能有很顺畅训练的异构能力,可不是一般团队可以搞定的。这还没有提到,根据各种模型的训练场景,提供的算子加速。最后就算你把所有一切都搞定了,因为大模型训练是同步计算,即使极低的故障率,也有可能让你的集群几分钟就趴窝一次。

就像,你买了一辆开几米就抛锚一次的汽车,你是有辆汽车就是跑不起来而已。说到这里,我想到了网上的一个问题,为什么大模型时代,全球似乎只有中美两个玩家?

那是因为,只有中美在之前 20 多年的互联网时代,凭借巨大的市场,产生了超级巨大的互联网企业。

而只有互联网企业,才拥有非常强大的云计算能力和成熟的数据处理经验。而这在 AI 时代,顺理成章地成为算力集群和数据平台的基础。没错,十几年前,当百度的技术团队开始研究 GPU 加速时,今天的故事就已经埋下了种子。

AI 的竞争已经进入了后半场,AI 落地,可能会比模型、数据和算列的故事要长很多倍。因为每一个行业,都会有自己难以解决的问题。

所以我们希望对每个行业的人来说,AI 训练也会像水电、网上开店一样简单。

只有这样,终有一天,AI 才会像水电、互联网一样,融入我们生活的方方面面,变成司空见惯的一部分。

我们做好准备了吗?也许百度们正在准备答案。

AI光子社
专注于AIGC的技术发展和商业应用,在人工智能时代,致力于让新技术为更多的普通人赋能增效。
 最新文章