祁晓亮老师在其宏文《时间、信息与人工智能》中,结合认知科学,勾勒了人工智能演化的路径。正如人脑具备直觉思考的系统1和深度思考的系统2(卡尼曼的理论),人工智能的发展也会发展出这两类系统并有机融合。
具体来说,单体大模型可理解为系统1,而智能体可理解为系统2。两者融合的重要机制是:类似于人类在经验中提炼直觉模版,智能体在使用大模型过程中所产生的数据可用来提升大模型智能水平。
据此或可提出智能飞轮的概念,如上图b)所示。上图中并列数据飞轮与智能飞轮,以资比较:数据飞轮旋转于算法、业务和数据之间,而智能飞轮旋转于大模型、智能体和数据之间。这种比较,可视为我在早先的文章 提出大数据时代到大智能时代的论断的一个延伸。
两种飞轮的三方面差异如下:
区别之一在于,数据飞轮的算法和业务是紧耦合的一体化驱动,而智能飞轮的大模型和智能体之间是松耦合的平台化支撑。这是因为,算法智能只能支撑特定业务(如抖音视频),而智能飞轮中的大模型可以支撑不同业务、不同企业的智能体,充分体现了其智能基础设施的定位。
区别之二在治理结构上:算法和业务是驱动和被驱动的关系,前者可以说是后者的统帅和灵魂。但大模型与智能体是支撑和被支撑的关系,智能体需要设计适当的工作流调用大模型,并非大模型的奴隶。如果我们把工作流设计当做某种算法,算法是智能体而非大模型的一部分。
区别之三在于数据。数据飞轮的数据反馈几乎是即时的,但智能体和大模型对话的数据不能直接用作训练。训练需要能提升预测正确率的高质量数据,须由智能体的使用者来手工准备。对于商业客户而言,这些数据会用来优化工作流(智能体),而非给到大模型厂商。大B私有化部署大模型看似解决了数据的问题,但卡在了模型训练上。绝大部分企业既没有能力也没有动机去训练底层的“通用”大模型。
某种程度上,飞轮这个隐喻极具误导性。飞轮暗示着要素之间同速同向。但在现实中智能体和大模型既不同速也不同向。一方面,它们构成的是一个多时间尺度的AI系统(参见祁文,如下图);另一方面,在利益方面,大模型厂家和智能体使用者的利益不一定同向。
可见,智能飞轮指向了一个值得憧憬的未来,但它转起来要比数据飞轮困难的多。若某种商业设计能够解决这些障碍,把理论上的必然性转换为现实的必然性,必将迎来巨大发展。