戴文渊回上海交大:回首的意义,是激励我继续求索

文摘   科技   2024-06-12 10:43   北京  
端午节前,上海交大一位毕业生回母校,分享自己毕业至今求索真理的旅途。

这位毕业生叫戴文渊,现在是人工智能企业第四范式的创始人兼CEO,曾经求学上海交大ACM班,并获得了ACM世界冠军(ACM班:上海交大2002年创办的计算机科学班,旨在培养顶尖计算机科学家)

从“ACM计算机学生”到“人工智能从业者”再到“人工智能赛道创业者”,戴文渊这一路经历了自我迭代、科技求索、创业破茧。

回首来时路的意义是什么?戴文渊认为,是让自己再度明白“求索“的意义。他在母校给学弟学妹分享职业生涯时说:人生没有既定的路,每个人都是独特的,交大教会了我独立思考,所以也希望学弟学妹坚持自我,走出自己“非比寻常“的路。

  • ACM班带给我最宝贵的,不是书本上的知识,而是一种“不走寻常路”的精神。
  • 要尽可能找到问题的本源和底层逻辑,不盲从权威,不盲目跟风,遵循底层科学理论。
  • 第四范式理论让我意识到,利用人工智能发现各行业规律,帮助行业创造价值,是立即可行的。



以下为演讲内容,在不改变大意的情况下,进行了删减和总结:

成就“不走寻常路”的我,开启AI求索之旅

我是2002年来到上海交大,也是第一届ACM班学生,让我记忆犹新的是,ACM班成立的初衷和目标是培养世界上最优秀的计算机科学家。当时的我将信将疑,那个时候不要说培养出最优秀科学家,国内连最优秀计算机科学家写的论文都很难看到。
学了一段时间后,我发现ACM班并不是照本宣科,而是跳脱出固有的教育模式,更为重要的是给予了我们做最优秀科学家的信心。有一次,被誉为“深蓝计算机之父”的许峰雄博士来交大演讲,这颠覆了我对于“深蓝计算机一定出自美国人之手”的固有认知。
同时,ACM班更为开放、先进的教育理念更是坚定了我们“做世界最好”的信心,它把我们送到了全世界最顶级研究机构、企业,而非从始至终在学校实验室中做科研,也因此培养了一批能在顶级学术会议、期刊上发出最好论文的学生。这也是我人工智能的启蒙过程。
可以看出,ACM班带给我最宝贵的,不是书本上的知识,而是一种“不走寻常路”的精神。正是这种刻在骨子里的精神,成就了现在的我,也是促使我成为更好自己的“源动力”。
我记得当时人工智能教科书的开篇都会讲到一个理论:奥卡姆剃刀原理。核心是讲模型要做简单,比如神经网络不能超过三层,决策树不能超过五层、回归模型参数不能超过一千个等等,这显然跟现在的主流技术思路相悖。
本着严谨的科学态度,我翻阅了很多资料,找到了得出奥卡姆剃刀原理的底层科学理论——Valiant引理,简单来说,就是模型参数量/复杂度要和数据量相匹配。所以,奥卡姆剃刀原理的局限在于当时的数据量不足以做出大参数量模型。

然而,因为奥卡姆剃刀原理出现在了课本上,成为了越来越多人的“固有定理”,从而忽略了底层的科学理论,直到深度学习的出现,大家才意识到奥卡姆剃刀原理的局限性。

即使是流行的热点理论也有其局限性。比如近期大家热议的Scaling Law,揭示了模型参数量和模型精度呈现指数级的关系。而根据统计学理论,二者应是线性关系。造成不同结论的原因在于现实中的数据不是均匀分布的, 如果按照正态分布区采集数据,每当要获得一个线性的效果提升,都要付出数据指数级提升的代价;如果能够更加均匀的采集数据,则有机会付出较小的代价实现模型效果提升。

时至今日,我们仍然被网上各种繁杂的信息所笼盖,作为AI从业者的我,仍旧保持着上学时对于AI求索的初心,要尽可能找到问题的本源和底层逻辑,不盲从权威,不盲目跟风,遵循底层科学理论。


“第四范式”理论让我找到了毕生求索之灯塔

早期做人工智能时,我也陷入过迷茫,人工智能到底能做什么?我曾经看过一个电影叫《人工智能》,讲述了一个小男孩最终发现自己是人工智能的故事。当我看完这部电影时,我问自己:人工智能什么时候才达到这样的水平?难道人工智能的作用就是制造一个类人智能体吗?

直至2007年,我遇见了让我重拾信心,且坚定将人工智能作为终身事业的“第四范式理论”,亦是我从交大毕业至今,所做事情的核心方法论。

这个理论由图灵奖获得者Jim Gray在2007年《科学发展的四个范式》的演讲中提出,其将科学发展总结为四个阶段。

  • 第一范式阶段,实验科学,人类记录实验现象,如钻木取火、摩擦起电等。
  • 第二范式阶段,理论科学,人类开始总结理论,诠释自然现象,如牛顿运动定律等。
  • 第三范式阶段,计算科学,人类通过计算机推演理论,模拟现象,如早期的气象预报等。
  • 第四范式阶段,数据科学,随着数据爆发式增长以及技术演进,科学理论由计算机从海量数据中发现。

“第四范式”彻底颠覆了“找规律”的方式,此前受限于人精力、记忆力的局限,以及数据的匮乏,所以得出的理论模型都较为简单。或者说,以往的定律、原理也许都是局限下的产物。若将“牛顿三大定律”让计算机去找,在数据足够多的情况下,完全可以总结三千万条甚至更多的规律,覆盖低速、高速等不同的速度区间。Valiant引理也得到了印证。
我意识到,我的目标不是做出那个《人工智能》电影中遥不可及的智能体,而是利用“第四范式”的方法发现各行各业的规律,帮助行业创造价值,是立即可行的
与此同时,“第四范式”也坚定了我“将模型做大”,反“奥卡姆剃刀原理”而行之的决心。如今,我们身处于数据爆发的时代,例如搜索引擎每天超过十亿次请求,我们对它总结规律,完全可以把模型参数做到千亿级。在使用了这个方法后,模型效果远远好于传统方法。以至于当我们想要进一步扩大模型参数时,学术界的数据集已经不够用了,促使着我们要去工业界找数据去实现更好的效果。
为了能尽快看到人工智能在各行各业创造出价值,我于2014年创办了名为第四范式的公司,就是希望把“将模型做大”的核心方法论让更多的人认知,并最终应用到各行各业。别人会经常问我第四范式是一家什么样的公司,我说第四范式是一家帮助其他企业实现第四范式的公司。这十年间,我们将“第四范式”核心方法论推广到了22个行业,1066个企业,完成了将近两万个行业大模型的构建。
然而,我也深知,我们做的还远远不够,希望未来能够通过我们的努力,真正将“第四范式”应用到这个时代,加速AI for Everyone时代到来。


第四范式
第四范式成立于2014年9月,致力于以AI决策驱动企业智能化转型,解锁企业高效增长和竞争力智能跃迁,驱动经营质变。
 最新文章