作者 | 梁昌均
运营编辑 | 李阳
“大家都说大模型是一个泡沫,但看看数据,ChatGPT从去年到现在,用户已达到2亿;全球前500的企业,92%的大企业都在使用大模型。这说明什么?大模型浪潮或机会来了以后不能错过,错过以后就无转机。”
在9月25日开幕的2024年国际信息通信展上,中国工程院院士刘韵洁谈及大模型时提到。
“我认为我们国家最大的机会是在行业大模型,我比较早提出这个概念。现在很多做大模型的专家也提出国家的行业大模型,我们国家在行业数据最全。”刘韵洁表示。
不过,这些行业数据的质量如何提升、共享和流通是目前的挑战。
刘韵洁认为,这需要政府出面,公开行业数据,把数据用安全的网络能够共享起来、流通起来。“如果我们有行业数据,我们的算法也不差,我们的数据要素也比较完整,行业大模型是我们的出路。”
目前,我国已经提出要建设数据基础设施和运营。刘韵洁认为,这正是为了数据共享,包括网络、算力、流通和安全,而这就是为了推动AI的发展。
“数据基础设施怎么数据共享?就是在传统互联网的基础上加上确定性的能力,要加上高速公路、高铁这样的功能。”
刘韵洁认为,传统互联网提供了很大的方便,但是它的缺点是能不能在现有网络上开通高铁,准时准点,把“尽力而为”变成“确保所需”。“这需要网络的弹性、智能和安全,需要网络有一个大脑,这个大脑就是网络操作系统。”
对于AI和网络对彼此的影响,刘韵洁认为,未来7年也好、10年也好,网络叫什么不重要,其发展驱动力在于需求。
第一个典型最大需求是AI大模型;其次,除了实体经济和AI,消费领域也在对网络架构、算力提出新的需求;第三个需求是智能体的出现,机器人对物理世界有感知并作出反应,对网络的需求也不容小视。
这些新的需求对网络提出挑战。刘韵洁提到,过去5年GPU算力翻了50倍,但网络带宽只翻了10倍,而GPU的需求速度会继续加快,对网络发展提高更高要求。
此外,大模型训练,对AI、对算力出现一个新的需求,就是它需要无损的传输,即丢包率为零,这也对传输技术带来挑战。
他认为,未来网络宽带的发展,要增加新的功能。第一个是端到端的确定性;第二个是整个网络支持可编程、可重构的能力;第三个是整个网络资源要实现一体化的调度。
“这些功能对整个人工智能、对未来的实体经济的发展是至关重要的,而我们国家已经在大科学装置上实现了这些能力。”刘韵洁说。
此外,刘韵洁表示,如果能够把网络的三个物理层面,即光、OTA光传输网和IP网融合起来,就完全可以秒级地开通的需求。
他认为,这样的网络能力如果能实现零丢包,传输效率做到95%,成本降低60-70%,这对推进“东数西算”、对运营商的提升能力,以及对大模型的训练,将提供一个非常好的空间。