文|李添诺
编辑|宋辰
19岁被普林斯顿全额奖学金录取,33岁成为斯坦福终身教职,44岁当选美国国家工程院院士,47岁被《时代》杂志评选为“百大AI人物”……
如果这样的履历还不够吸引人,那就再加一条——首次创业仅三个月,估值超过10亿美元,成为全球最快独角兽公司。
拥有这么一份傲人履历的,就是被业界誉为“AI教母”的知名华裔计算机科学家李飞飞。在几乎由男性统治的AI界,她成为最富传奇色彩的存在。
今年4月,还在斯坦福任职的李飞飞,在假期创办了AI公司World Labs。短短三个月,World Labs完成了两轮融资,投资者包括安霍创投和AI基金Radical Ventures等,其中最新一轮的融资金额约1亿美元,估值超过10亿美元。
World Labs主要研究“空间智能”。这种技术有可能帮助机器人获得像人一样的空间智慧能力,使人工智能具备高级推理能力。
李飞飞是如何一步步、成为科技界新领袖、AI领域“教母”级的存在?
艰难的物理探索之路
李飞飞1976年出生在北京,家庭原本还算殷实,成长于成都。受父母影响,李飞飞从小就是别人眼中优秀的孩子。中学时,为了让她有更好的教育,父母决定移民美国。
不过,李飞飞在其自传《我看见的世界》里坦言,父亲先于她和母亲拿到签证去美国的那两年,她过得异常艰难。但她一直保持着对物理的兴趣,这是父亲从小潜移默化对她的影响。
“在初二结束时,我意识到,物理学已经不仅仅是我在青春期为填补缺席而做出的努力。我爱物理,就像父母爱着他们从我幼年时期就跟我分享的追求一样,这份爱简单而纯粹。”
1992年,李飞飞刚满15岁不久,她和母亲的签证下来了。怀着复杂的心情登上飞往美国的航班,在地球另一端开启新生活,对一个还不确定自己在世界上的位置的少女来说,一切显得那么不真实,“但不管怎样,我还有物理学”。
刚来美国时,李飞飞一家三口挤在一套狭小的一居室内,空间极其逼仄。为了布置小家,他们会格外留心别人丢弃在车道和路边的家具。在国内有着体面工作的父母只能去修相机和当收银员。
这样的落差也曾让李飞飞感到难过和伤感,更让她难以接受的是,当时的长途电话费非常昂贵,每次和国内的外祖父母通电话都匆忙到残忍,连跟最爱的人说说话都要争分夺秒,这种感觉实在荒谬。所以,她决定自己去赚钱。
李飞飞的兼职第一份工作是在商业街上一家狭小昏暗的中餐馆当服务生。她要从上午11点工作到晚上11点,每天12个小时,每小时2美元的工资。整个高中阶段,除了在中餐馆打工,她还每周去给人做家务、遛狗。
一次周末全家游历李飞飞来到了普林斯顿大学。当时,她对这所大学的历史和传统一无所知,只是觉得校园景观和建筑美轮美奂。走着走着,李飞飞看到了一尊爱因斯坦的青铜半身像,铜像底座碑文上介绍爱因斯坦的文字,让她心灵震颤。
在日复一日专注生存之际,李飞飞对物理学的热情已经悄然消退。但在看到这尊铜像的那一刻,她自己感到,这种热情又回来了。她又重新找到了追逐的目标。
那一年,是李飞飞来到美国第二年,她进入了高三,斗志重燃,希望在数学和物理学科证明自己。但英语上的劣势,让她再次受挫,学年第一次数学考试,并没有考到自己满意的A-。不过,因为对数学和物理的热爱,她成为下课后去数学实验室寻求帮助最勤快的学生。
很快,李飞飞的高中学习即将结束。一开始她的目标是州立大学和社区大学,而不是常春藤盟校。但一直对普林斯顿大学念念不忘,即便知道学费昂贵,她还是无法抑制内心的冲动提交了申请。意想不到地是,她不但被普林斯顿大学提前录取,还收到了近乎全额的奖学金。
但生活的拮据依然困扰着李飞飞一家。母亲因身体原因不能继续工作,为了继续维持生活,全家借款开了一家洗衣店。大二时她发现自己对物理学的热爱丝毫未减,同时对计算机产生了兴趣,并报名参加了自己的第一门计算机科学课程。
打开人工智能神秘大门
李飞飞上大学的20世纪90年代,象征着一个全新时代的来临。辛顿的反向传播技术似乎为神经网络提供了最后的一块拼图,而杨立昆在手写数字识别方面的成功,则为算法在现实世界中的应用提供了无懈可击的验证。
但机器学习的理论与实践之间却存在这偏差。不久之后,“人工智能寒冬”来临,研究界失去了方向和支撑,进入了一个漫长的低迷期。但李飞飞在导师们的引导下,开始关注视觉研究。此后,它将成为李飞飞一切学术旅程的主线,成为她世界的中心。
1999年,李飞飞在普林斯顿大学的学习生涯即将结束,再次面临科学抱负和现实生活之间的选择。读研的诱惑与开启职业生涯的压力让她左右为难。这是一个真正的两难困境:
当时,网络经济正在蓬勃发展,盛况空前,拥有数学头脑和名校学位的人成了金融界热切追捧的对象,拥有物理学背景的李飞飞受到了华尔街的大力招揽,包括高盛和梅林在内的众多知名企业向她抛出了橄榄枝,他们甚至承诺免除李飞飞家庭的债务,结束干洗店的劳累,在母亲的健康状况日益恶化的情况下为她的家庭提供保障,唯一的要求就是她放弃科学。
在斟酌了大半个星期后,李飞飞终于向母亲提起了华尔街投行们的巨大诱惑。母亲反问她:“飞飞,这是你想要的吗?”“你知道我想要什么,妈妈。我想成为一名科学家。”“那还有什么好说的呢?”
于是李飞飞重新回到了科研中。普林斯顿大学的教授们常说,研究生学习不仅仅是另一个学术里程碑,更是一个转折点,代表着从学生到成为真正科学家的第一次转变。在视觉研究方面,李飞飞面临两个选择:神经科学和计算科学。
神经科学可以让李飞飞更深入地了解大脑的能力,而计算科学则可以利用工程学的原理来建模,甚至复制智能能力。
李飞飞决定两者兼修。
不过,同时研究这两者的组合并不常见,至少在当时的硕士项目中不常见,但有几所高校可以满足李飞飞的需求,一个是斯坦福大学的双轨项目,融合了神经科学和电子工程学;另一个是加州理工学院。权衡之下,她选择了后者。
李飞飞很享受在加州理工学院的日子。这里的生活不会轻松,但她对这里的感激之情比以往任何时候都更加深厚。她和父母卖掉了干洗店,这是他们去美国后母亲第一次有机会休息。更重要的是,她对学业充满了热情,几乎付出了全部努力。
2004年,李飞飞和团队创建的Caltech 101完工,成为有史以来为机器学习配置的最大规模的图像集合,里面有炒股9000个图像,分布在100个类别中,另外他们还独立完成了一个新类别的图像整理。2005年,李飞飞获得加州理工学院电气工程博士学位。
2006年李飞飞开始构思发明的ImageNet图片数据集。2007年,李飞飞在斯坦福大学启动了ImageNet项目,“李飞飞”三个字在人工智能领域声名鹊起。
ImageNet成为新一代人工智能技术的三大基石之一,另两大基石是GPU和神经网络技术。可以说,如果没有ImageNet,就没有生成式人工智能,就像人类没有眼睛。
但ImageNet并非一帆风顺。“ImageNet不仅是一个数据库,它是一个假设、一个赌注,即实现真正机器智能的第一步,是沉浸在完整的视觉世界中。在这个赌注无论被证明是对是错,我都做好了准备。但我没想到,它被忽视了。”李飞飞在自传中谈到。
2010年,为了提升 ImageNet 的名气,李飞飞举办了ImageNet 大规模视觉识别挑战赛,旨在激发学术界和工业界的创新,推动计算机视觉技术的发展。ImageNet数据集项目是如今生成式AI技术的底层设施,包括ChatGPT技术也受益于ImageNet的数据支持,并且已成为很多深度学习算法和模型的重要测试平台。
2016年11月,李飞飞于接受了谷歌公司的邀请,出任副总裁并担任Google Cloud AI首席科学家。2020年,李飞飞当选为美国国家工程院院士,同年当选为美国国家医学院院士,2021年,当选为美国艺术与科学院院士。
从学界到商界
“人工智能还能做哪些事来帮助别人?”母亲在病床上的问题,让李飞飞开启了医疗服务的环境智能研究。从学界的角度探讨人工智能的落地。
在母亲身体每况愈下之时,李飞飞和母亲在病房里讨论人工智能以来的几个月里,她一直在思考如何把人工智能与病人护理结合起来。只要有机会,她就和同事聊天,不管他们来自那个系。而正是母亲的那个问题让李飞飞的职业生涯走上了全新的道路。
“这么多年来,推动我前进的一直是强烈的好奇心,而现在,我第一次将人工智能视为行善的工具,可以疏解像我这样的家庭每天所面临的困难。我第一次接触到了人工智能的伦理问题。”李飞飞在自传中说道。
同时,经过和他人合作,她得到了两个重要的启示:人工智能最伟大的胜利不仅是科学上的,也是人文上的;伟大的胜利,没有他人的帮助是不可能实现的。
随着AI进入新的发展阶段,李飞飞转型创业,开始了人生的另一段经历。
2024 年1月,李飞飞离开斯坦福大学,开始为期两年的休假,彼时她在领英上将自己的状态改为“新手”。
随后,World Labs成立。这也是李飞飞的第一次创业,聚焦于空间智能。
空间智能指的是建立世界模型,让计算机能够在三维世界中感知和行动。李飞飞在 X(原推特)上介绍,空间智能是AI拼图中的关键一环。视觉变成了洞察力;洞察力变成了理解力;理解力推动了行动。所有这些都产生了智能。
今年4月,李飞飞在TED演讲中展示了一张“猫伸出爪子要把装有牛奶的杯子推下桌子”的图片,阐述了空间智能——
“在看到这张图片的一瞬间,人类大脑会开始分析玻璃杯的形状、在空间中的位置,以及与周围物体的关系,并产生想要行动的冲动。这种冲动就是具有空间智能的生物的本能,能够将感知和行动联系起来。”
虽然成立短短三个多月,World Labs进行了两轮融资,投资方包括硅谷知名风投a16z和AI基金Radical Ventures,最新一轮融资额约1亿美元。
在自传中,李飞飞认为,我们要从根本上重新构想人工智能,使其成为人为本的实践,这个共同的目标就是下一颗北极星。
可预见,World Labs只是李飞飞寻找下一颗北极星的开始。