“AI教母”李飞飞 | 当AI开始睁眼看世界

乐活   2024-06-24 18:45   北京  

It was the best of times, it was the worst of times, it was the age of wisdom, it was the age of foolishness, it was the epoch of belief, it was the epoch of incredulity... we had everything before us, we had nothing before us.

—— Charles Dickens 

A Tale of Two Cities


这两个月,李飞飞一直没闲着,她活跃在大众视野中,频频制造爆点话题。

——参加TED演讲、为自己的初创公司拉投资、一篇“人工智能不具有感知力”的文章激起千层浪...


深入了解这位传奇的华人女性科学家后,我们发现围绕在李飞飞甚周身的光环从不曾消退:


斯坦福大学计算机科学系首任红杉教授,谷歌云 首席科学家,美国国家工程院、医学院和艺术与科学院三院院士...


图/李飞飞在斯坦福人工智能研究室


然而这些沉甸甸的荣誉,都不足以概括她对人工智能贡献。比起她的本名,她还有个更响亮的名字——“AI教母”("The Gof Mother of 'AI'")。



1

AI教母,从何而来


“教母”在西方宗教中是重要且神圣的角色。她们作为接纳新生,为其引路之人,将伴随一名信徒的一生,成为他们的精神领袖。


2006年的人工智能领域还如同一潭静水,计算机视觉这一分支更鲜少被人问津。这一年,30岁的李飞飞刚刚获得计算机视觉博士学位。


当时获得更多学者认可的观点是:算法远比数据重要得多。当李飞飞的同行们正“随波逐流”,通过构建特定的算法来识别不同物体时,李飞飞却坚信,大量真实世界数据才是让算法更加准确的关键。


——如果一个孩子通过观察足够数量的物体和场景来体验视觉世界而学会看,也许计算机可以通过分析各种图像及其之间的关系来模拟学习。


受到WordNet的启发,雄心勃勃的李飞飞决定基于其对词汇分类的方式,建造一个能够支持视觉识别物体的数据库——ImageNet。


WordNet 基于词汇的语义关联而非拼写相似性进行分类。如“apple”与“appliance”虽拼写接近,但在 WordNet 中,“apple”会与“food”、“fruit”、“tree”等相关词汇形成关联。


完成对库内图片的标注也是一项巨大的挑战。ImageNet团队与名为Amazon Mechanical Turk的众包平台建立合作,将标注任务下发,由平台的“Turkers”来判定图像是否与给定的单词匹配。

图/ImageNet基于WordNet标注图片


接着,时间来到里程碑式的2009年6月20日,首篇关于ImageNet的论文发表、第一版数据集正式上线。这时的ImageNet包含 22,000 个类别的 1500 万张图像,一举成为世界上最大的公开图像标记数据集。


为吸引更多人的关注,ImageNet开设了ImageNet Large Scale Visual Recognition Challenge(ILSVRC),通过ImageNet测试参赛模型算法,参赛模型必须正确识别并分类图像场景,生成错误率最低的模型团队将会获胜。


ILSVRC成为计算机视觉的主要基准,这时研究人员才意识到,更多的数据对模型来说才是更重要的。


“ImageNet思维的范式转变是,当很多人都在关注模型时,我们关注数据,数据将重新定义我们对模型的看法。”

——李飞飞


2012年的ILSVRC再次成为CV发展史上又一里程碑。由Geoffrey Hinton团队开发的AlexNet超出所有人预期,成为第一个图片识别错误率低于 25% 的模型,领先第二名9.8个百分点。


图/AlexNet与其他参赛模型对比


AlexNet是卷积神经网络(Convolutional Neural Network,CNN)的一个实例,其名称来源于图形卷积过程,这是一种独特的有机设计,即视觉处理在多个层次上进行。


图/CNN架构


就像在自然界中一样,卷积神经网络的每一层都会逐渐整合更多的细节信息,从而形成越来越高层次的感知,最终将真实世界的物体呈现在我们的视野中,如同人脑对物体的识别和分析。


到2017年,短短7年内计算机对图像识别的准确率上升到 97.3%,甚至超过了人类的能力,有效地证明了更大的数据会带来更好的表现。


ImageNet被称为The Birth of Deep Learning,当Chat-GPT、Google Gemini、Stable Diffusion、DALL-E和Midjourney这些建立在大量数据之上,令世界惊叹不已的模型问世的时候,李飞飞则表示:


“如果让现在的我与15年前的自己讨论这些大模型,我也不会感到惊奇。这些模型都是基于大量预训练数据实现的,这就是我一直希望看到,并且推行的观点。”




2

AI教母?我不认可


尽管AI教母这一称呼早已让李飞飞享誉世界,但她从不用这个名字称呼自己,甚至表示自己并不喜欢这个title。


"I would never call myself that," she said. "I would never, ever call myself godmother of anything."


斯坦福大学HAI(“以人为本”人工智能研究院)五周年庆典举办了一场AI届女性的圆桌论坛,李飞飞再次被问到关于这一称呼的看法,她说:


“如果真的要用这个称呼,那‘教母’这个词应该是复数(godmothers),AI届的女性们都可以是‘教母’,我不希望它是单一的,我们应该承认更多女性的贡献。”


图/HAI五周年论坛


这不是她第一次公开发表这样的观点,去年12月,《纽约时报》发表了《现代人工智能运动黎明背后的名人录》(Who's Who Behind the Dawn of the Modern Artificial Intelligence Movement),12位现代人工智能创造者,竟没有一位女性的身影。


名单一经发布就引发了许多争议,李飞飞在推特上发文:(我说这番话的原因)不光是因为我,而是关乎我们所有在人工智能领域的人,所有那些不可思议的“教母”、先驱,积极的研究者,来自各行各业的学生...


图/李飞飞支持AI届应该有更多女性身影


如李飞飞所言,她不是一个自负的人,但作为技术领域中为数不多的女性之一,在AI爆炸式增长的时代,她们的身影确实被遗忘了。


2012年,当Geoffrey Hinton的团队站上领奖台时,李飞飞突然意识到领域内很少能见到有女性的身影,如果让其发展下去,将成为一个严峻的问题。


人们会很自然地将自己的认知和感受转移到所从事的事业中,虽然驱动人工智能的算法可能看起来是中立的,但塑造这些算法结果的数据和应用程序却很可能不是。


麻省理工学院和Microsoft的研究人员就曾发现,IBM和Microsoft提供的面部分析服务在识别深色皮肤的女性照片时经常出错。


图/2015-2016年,计算机科学领域人种分布


李飞飞同样感受到有色人种在计算机科学领域受到的局限。在她自己的实验室里,也很难招募到有色人种和女性。


“如果我们在20年后醒来,看到我们的技术、领导者和从业者缺乏多样性,这一天将是‘世界末日’。”

——李飞飞


偏见的人工智能将带来不可预估的后果,这促使李飞飞产生了在AI领域为代表性不足的人群创造更多机会的想法。于是,她与自己的学生奥尔加·鲁萨科夫斯基创办了一个夏令营,特别招募对人工智能领域感兴趣的女高中生。


两年后,非营利性的AI4All项目启动,以“让 AI 更加多样化和包容性”为使命,将包括女孩、有色人种和经济弱势的人带到斯坦福大学的校园。


图/AI4ALL夏令营合约


当来自不同身份和背景的人共同构建一套系统时,他们的想法和观点将孕育更具有创新性、更以人为本的AI。


李飞飞对AI4ALL的年轻人们抱有极大期望:我相信我们的下一代是勇敢的、无所畏惧的,他们看待世界的方式比我们更多维。这些多元化的学生将成为下一代人工智能领导者、AI变革者。




3

让AI“以人为本”


抱着对人工智能的积极态度,李飞飞始终相信,如果通过人类正确的引导,AI不仅会成为有用的工具,更能成为值得信赖的合作伙伴。


图/JackRabbot 1机器人,斯坦福大学AI研究室


纵观历史,人类并非没有经历过技术变革,这些变革也会不可避免地带来一些阵痛,但并没有一次因为科技进步而带来世界的坍塌。


2019年,李飞飞牵头组建了斯坦福HAI,以正直、人类、平衡、独立、多样性与跨学科性为价值观,将跨性别、年龄、种族、文化背景的真正多元化的思想引领和应用人工智能,从智慧医疗入手,力争改善人类生存状况。


图/HAI创始人John Etchemendy和李飞飞


技术发展的力量始终在人,因为改变世界的终究不是科技,而是创造科技的我们;当人工智能改变着世界,又是谁在改变人工智能?


"对于开创那些最前沿、可以造福人类的技术,以及培养出未来可以做这些贡献的技术人才,我始终抱有极大的热情和责任。我觉得这是我的夙愿和使命。”

——李飞飞


换句话,当改变AI的人怀着“人本之心”改变世界时,我们还需担心什么呢?




- END -






我们更懂世界,让世界更懂我们

点击关注我们,一起超越文明隔阂



甲骨易
国家语言服务出口基地,国家文化出口重点企业,首批语言服务新三板挂牌企业(股票代码:870633),深耕多语服务20+年,是全球最值得客户信赖的多语言供应商,致力于全球范围内的跨文化沟通。了解更多甲骨易的信息:www.besteasy.com
 最新文章