如果问,谁是当下人工智能领域最炙手可热的学者,那非“AI教父”杰弗里·辛顿莫属。他坚守人工神经网络的研究方法,熬过人工智能寒冬,最终在2024年凭此获得诺贝尔物理学奖。
杰弗里·辛顿
图源:Wiki Commons
但是人工神经网络之所以能重回人类视野,不得不提的一个人就是华裔女科学家——李飞飞。正是在她所举办的“ImageNet大型视觉识别挑战赛上”,辛顿团队提交的算法——AlexNet在图片识别准确率上战胜了其他算法,获得了2012年的冠军。可以说,这次获胜不仅拯救了辛顿,也拯救了李飞飞:辛顿坚持多年的人工神经网络证明了自己,并随之掀起了一波科技与应用的狂潮;ImageNet也通过这次比赛让越来越多的人认识到,李飞飞关于计算机视觉的设想和研究路径是正确的。
李飞飞生于北京,长于成都,15岁时随母亲来到美国跟父亲团聚。本科毕业于普林斯顿大学物理系,博士毕业于加州理工大学物理系。毕业后,先后在伊利诺伊大学香槟分校、普林斯顿大学和斯坦福大学任教,并于学术休假期间(2017年—2018年)在谷歌担任副总裁以及在谷歌云担任首席科学家职务。现为斯坦福大学以人为本人工智能研究院主任,并被选为美国国家工程院、美国国家医学院、和美国艺术与科学院三院院士。
当地时间2017年3月8日,美国加州旧金山,谷歌云首席人工智能科学家李飞飞在2017谷歌云大会上发表主题演讲。
图源:视觉中国
虽然履历光鲜,但她的成长之路充满了坎坷,单是能决定人生走向的“大考”就至少有三次,但凡任何一次大考的结果略有不同,她的人生和人工智能的历史都将被改写。
老师说,
女孩长大后会越来越笨
李飞飞人生的前几年在成都生活得无忧无虑,父母都属于那个年代的知识分子,父亲在化工厂的计算机部门工作,母亲做过高中老师,后来在办公室做职员。受家庭熏陶,她一直是班里的好学生,在知识的海洋追逐自己的兴趣,从没意识到自己跟其他孩子有什么不同。直到小学的最后一年。
一天下午放学后,老师让班里的女孩先回家,男孩留一下。飞飞好奇,就躲在教室外面偷听,而听到的内容让她终生难忘。老师先是告诉班里的男孩,自己对他们很失望,因为他们作为男孩天生就比女孩聪明,在数学和科学方面更应如此,但是现在他们的成绩却不如女孩。接下来老师鼓励道:
但你们也不要自暴自弃。等到了十几岁,你们会发现,周围的女生自然就变笨了。她们后劲不足,成绩会不断下降。即便如此,我还是希望你们都能更加努力,发挥你们作为男生的潜力。落在女生后面是不可接受的,大家明白了吗?
说出这番话的竟然是位女老师。飞飞先是对这段话惊讶不解,之后是压制不住的愤怒,唯独没有的,是真的相信这句话。她在《我看见的世界》里回忆道,越来越多之前没注意到的现象证实了老师的话:老师们在数学和科学方面更经常鼓励男生,她去报名学校的足球赛校队却被告知女生不能参加。但她的反应却不是坦然接受:
这些话强化了我成长过程中形成的理念:无论周围有什么障碍,都要奋力超越现实,构想出更加广阔的未来。现在我不仅想看得更远,还想走得更远。如果说数学和科学这类领域是属于男生的游戏,那又怎样,学习毕竟不是球赛,他们无法阻止我在这里上场参赛,我暗下决心,一定要赢。
帮李飞飞塑造这种理念的,是她的家人。父亲对任何正经事情都“严重过敏”,但经常愿意花几个小时带飞飞去抓蝴蝶和观察水牛,这些亲近大自然的爱好向自己的女儿“展示了最纯粹的好奇心”,让飞飞在学业上对数学和物理学越来越着迷。母亲和外祖父母则是给她买了各种各样主题的书,并鼓励她“展开想象,并坚守原则:我首先是个独立的个体,其次才是个女孩”。
家境贫寒,
继续深造还是赚钱养家?
虽说在国内属于中产家庭,但是到了美国后,人生地不熟,语言不通的一家三口生活非常拮据。父亲找了份在一家小店修理相机的工作,母亲在礼品店做收银员,两人收入微薄,飞飞也在上课之余去中餐馆做服务生补贴家用。
一方面是家庭境况的一落千丈,而且短期内看不到起色,另一方面是母亲的身体开始不断出现问题。她的身体状况本就不适合生孩子,但她还是冒险生下了飞飞,到美国之后因为生活压力而多次动手术,但每一次手术对于这个新移民家庭来说都是莫大的困难。
在大学毕业前夕,李飞飞面临着工作还是读研之间的抉择。像她这样拥有物理学背景的藤校学生,很受华尔街金融公司青睐,高盛和美林等知名企业向飞飞发出了邀请,除了高薪和医疗保险,他们还“承诺免除我们的债务……在母亲的健康状况日益恶化的情况下为我的家庭提供保障。而对我唯一的要求就是放弃科学”。飞飞陷入了犹豫,跟母亲提起了这件事。母亲表现平淡,只问了一个问题:“这是你想要的吗?”飞飞又强调了单是自己的薪水就可以彻底改变家人的生活。母亲又问:“飞飞,这是你想要的吗?”飞飞说:“你知道我想要什么,妈妈。我想成为一名科学家。”
在母亲的坚持下,飞飞去加州理工大学继续攻读物理学。两年后,她找到了自己的学术“北极星”:计算机视觉。很快,她和导师共同发表了一篇关于“单样本学习”的文章,这种方法完全不同于当时占据主导地位的图像识别方法。这篇论文受到了意料之外的欢迎,飞飞也有机会去法国尼斯的国际计算机视觉会议做口头报告。报告很成功,但会议上其他学者的提问也为她接下来的研究指明了方向:增加数据集中的数据类别和数据规模。正当她与导师讨论决定下一步计划后,母亲的心脏又出现了问题,这次他们卖了已经经营7年的干洗店,给母亲做了手术。之后她把父母接到了自己的宿舍里来住,以便有个照应。但母亲的手术和狭小的空间再次让她看到了科学理想和生活现实之间的张力:
毕生的好奇心把我带进了一个竞争激烈、薪酬低廉、无法保障长久职业生涯的领域,而我的父母现在需要我无法提供的支持。我每天都在追求自己的梦想,这让我觉得自私至极,甚至过于鲁莽。……难以否认这样的一个事实:成为科学家是一种奢望,我负担不起。
于是,飞飞去麦肯锡公司参加了面试,并拿到了高薪offer。但她回到家时,忘了脱下为面试而暂时买来的衣服。母亲问她为什么穿成这样,她开始跟母亲描述麦肯锡所能提供的优厚待遇,并解释说这是每个移民家庭都会期望的工作机会。但还没说完就被打断了,母亲表示没有必要再次讨论这个问题了,她了解自己的女儿,她不是什么管理顾问:“她是个科学家。”飞飞提到母亲的身体和家里的开销,而搞学术让未来看不到什么希望。
“飞飞,我们走到这一步,不是让你现在放弃的。”母亲继续说,我们家现在是过得不好,你把自己对科学的追求说成是自私的,但事实完全不是这样。自从我们在上海坐上飞往美国的飞机,我们就已做好了一切准备,这是我们三个的决定,不是为了你一个人。而且,我们一起经历了这么多,不是为了让你现在放弃的。
飞飞的北极星又闪耀了起来。
众人反对,
还要不要继续ImageNet项目?
从加州理工毕业后,飞飞顺利拿到了伊利诺伊大学香槟分校的教职,一年后转到普林斯顿大学做助理教授。
在普林斯顿大学期间,她跟自己的博士生一起开启了ImageNet项目,但是无论是自己的同事,还是非常敬重的老者——吉滕德拉(导师的导师),都不看好这个项目。
这个项目是“单样本学习”论文思路的延续。李飞飞认为,从演化的历史来看,视觉的出现在动物智能以及人类智能的产生中扮演了关键作用,因而通用人工智能的第一步,一定是一个可以观察并理解外部世界的机器智能,而外部世界包含的事物多种多样。为了训练出这样的机器智能,首先需要构建一个能反映外部世界复杂性的图片数据库,这个数据库中包含的事物种类,应该差不多等于外部世界中的事物种类。基于前人的研究和自己的筛选,她把这个种类确定为2.2万个。但要给每一个种类找多少张照片呢?暂定1000张。这样,他们一共需要分属于2.2万个种类的2200万张图片。
三个问题横亘在眼前,一是去哪里找到这么多照片,二是如何完全标注这么多照片。根据她的团队当时的速度,做完这个项目大概需要19年的时间,而这个时间,她的博士生和她自己都等不起。经费则是第三个问题,普林斯顿大学助理教授能使用的经费完全不足以支撑这个项目。
一年后,项目没有实质进展,飞飞在会议上遇到了曾给予自己很大帮助的吉滕德拉。后者在听完她的描述后不敢苟同地说:“科学的诀窍是跟随着你的领域一起成长。不要太超前。”飞飞深受打击,因为她本想以后申请终身教职时请吉滕德拉给自己写推荐信。
接下来的几个月她完全不知道该怎么办,也不知道该怎么面对自己的博士生。
直到一天,一个学生告诉她,亚马逊公司提供的全球众包服务或许可以帮她做标注。采用了亚马逊的众包服务后,ImageNet项目恢复了生命力,在高峰期,他们甚至是亚马逊众包服务最大的雇主之一。
2019年6月,李飞飞项目组做成了ImageNet的初始版本,他们从近10亿张图片里筛选出了1500万张图片,涉及2.2万个类别,并由4.8万名来自160多个国家的贡献者做了手工标注。
李飞飞准备就绪,要去参加2009年的计算机视觉与模式识别大会,作为演讲者向世界展示ImageNet。但是去了会场才发现,ImageNet被降级为“海报展示”,没有演讲介绍的机会。李飞飞在书中这样描述自己的心情:
ImageNet不仅是一个数据集,它是一个假设,一个赌注,即实现真正机器智能的第一步,是沉浸在完整的视觉世界中。这个赌注无论被证明是对是错,我都做好了准备。但我没想到,它被忽视了。
命途多舛。不自信,不甘心,但仍不死心。
为了让更多人知道这个项目,李飞飞跟自己的博士生在2009年举办了第一届“ImageNet大型视觉识别挑战赛”,开放图片库中10%左右的图片,全球的研究者都可以提交自己训练的算法来参赛,识别准确度最高的算法将获胜。但是一连几年,获胜的算法都还是在过去的框架内游走,没有什么特别之处,而且参赛人数从第二年就开始下降。希望又逐渐渺茫。直到2012年。
2012年获胜的算法与往年的都不一样。不仅因为它是一种老古董——神经网络算法,而且,它有85%的识别准确率,比上一年的冠军高出10个百分点,这一神奇的提升速度让李飞飞很震惊——“根本不可思议。进步不应该是这样的”。
获胜的算法,就是辛顿团队提交的AlexNet。
故事还要回到2011年。当时辛顿正在极力说服吉滕德拉,让他相信神经网络代表着人工智能的未来,但是在吉滕德拉的挑战下,辛顿拿不出像样的算法来证明自己的观点,他没有足够大的用来训练算法的数据集。
这时吉滕德拉告诉他,可以关注下李飞飞的实验室的工作。而辛顿听取了他的建议,第二年就向ImageNet挑战赛提交了算法,并且赢得了冠军。如此,才有了我们今天看到的“AI教父”和“AI教母”。
让人唏嘘的是,有时候人生特别有希望,你不用刻意努力,就有各种各样的力量推着你前进;有时候人生又特别绝望,甚至多一步都走不下去。但是,绝望通常跟希望同时存在,只不过,身处绝望之中时,希望的火种通常在我们的视野之外。很多时候,只要再多坚持一下,它就会通过某种方式来到你眼前。