Keras之父，离职谷歌

科技 2024-11-14 11:46 北京

金磊发自凹非寺
量子位 | 公众号 QbitAI

刚刚，谷歌官方宣布了一条重磅消息：

Keras之父François Chollet，正式离职。

这篇文章由谷歌两位VP（包括谷歌刚挖来的华人Bill Jia）共同撰写，表达了对这位在谷歌长达9年零3个月的AI大佬，在工作上的认可及离职的惋惜。

从内容上来看，谷歌先是肯定了Keras这个深度学习框架目前取得的成绩——

已经成为人工智能发展的基石，用户数量超过200万，简化了复杂的工作流程，让尖端技术变得唾手可得。

并且这项技术已然得到了广泛地应用，从Waymo的自动驾驶，到YouTube、Netflix和Spotify的推荐等。

不过虽然François已离职，但他承诺将继续参与Keras未来的发展，还将继续支持JAX、TensorFlow和PyTorch上的工作。

而谷歌的Keras团队，则将继续与François的开源社区保持合作。

至于François最新的动向，谷歌和其本人截至目前并没有透露。

而网友们对于François的离职却展开了一番激烈的讨论。

例如从Keras的发展现状来看，有人认为它在谷歌已经不香了：

我曾在某处看到，未来TensorFlow可能不会得到积极开发，谷歌内部转向了JAX；TensorFlow几乎已经输给了 PyTorch。

针对谷歌在官宣中对Keras给出的评价，有网友表示：

若是在2018年，这是事实；但现在，PyTorch的受欢迎程度远高于TensorFlow，其中很大一部分原因与LLM有关。

而从François个人动向方面来看，有网友猜测他可能被Anthropic挖了墙角……

Keras：为人类设计的深度学习

Keras最早可以追溯到2015年，是由François发布的一个开源神经网络库。

它最初的目的是提供一个高级深度学习API，用来简化深度学习模型的构建和实验过程。

因为在Keras出现之前，深度学习开发通常需要直接使用底层库（如Theano），用户需要编写大量复杂代码才能构建一个基础的神经网络模型。

而Keras的出现可谓是改变了这一局面。

它通过模块化和直观的API让深度学习的构建流程大大简化，极大地降低了进入深度学习领域的门槛。

正如它官方给自己的定位那般：

为人类设计的深度学习。

Keras一开始是独立于具体计算引擎的高级库，支持Theano、Microsoft CNTK和TensorFlow作为其底层后端。

在技术上，Keras采用模块化的设计，用户可以通过组合不同类型的层（如全连接层、卷积层、循环层）来快速搭建复杂的模型。

模型的训练、验证和测试过程通过统一的接口实现，开发过程可以说是非常顺畅。

Keras提供了Sequential API用于线性堆叠模型层，后来又引入了Functional API，来支持复杂的非线性网络结构和多输入多输出模型的构建。

这些特性让Keras不仅适合简单的原型设计，还能够应对实际生产中的复杂需求。

但随着TensorFlow的快速发展，二者之间的关系变得越来越紧密。

到了2017年，Keras被谷歌选择成为TensorFlow官方的高级API。

在TensorFlow 2.0于2019年发布之后，Keras完全集成到了TensorFlow中，成为其默认的模型构建工具。

这标志着Keras从一个独立的高级库转变为TensorFlow的一部分。

这样做的好处当然是有的。

首先，Keras可以无缝调用TensorFlow的底层功能，从而提供更高的性能和可扩展性。

其次，TensorFlow提供了诸如GPU加速、TPU支持、分布式训练等高性能特性，整合后的Keras也能够轻松利用这些特性。

这种转变不仅增强了Keras的功能，还使得它更适用于生产环境的大规模应用。

然而，随着整合的推进，Keras作为独立库的角色逐渐淡化，tf.keras成为TensorFlow官方高级 API，也成为深度学习社区的标准选择之一。

除此之外，作为深度学习框架演变的缩影——TensorFlow和PyTorch之间的竞争，也一定程度上波及到了Keras的发展。

PyTorch是由Facebook AI Research在2016年推出。

它的核心优势在于动态计算图（Dynamic Computational Graph），可以让代码执行得更加灵活，开发者可以像编写普通Python代码一样进行模型的构建和调试。

相比之下，早期的TensorFlow采用静态计算图（Static Computational Graph），尽管执行效率较高，但在模型开发阶段的灵活性和调试便利性方面逊色于PyTorch。

这种技术差异使得PyTorch特别受到研究人员的青睐，尤其是在实验和快速迭代等工作中。

为了缩小与PyTorch在灵活性方面的差距，TensorFlow 2.0引入了与其类似的动态图功能，通过Eager Execution和 tf.function 提供了更为灵活的开发体验。

这一演变使得TensorFlow在保持高性能优化的同时，也具备了PyTorch式的开发灵活性。

但此举似乎并未完全弥补与PyTorch在用户体验上的差距。

当然，Keras这边也是在不断迭代优化。

例如在去年年底，Keras发布了3.0版本，被誉为改变了机器学习游戏规则。

不仅支持TensorFlow、PyTorch、Jax三大框架作为后端，还能在它们之间无缝切换，甚至混合使用。

François当时在自己的社交账号中概述了这样做的四大好处，包括：

始终让模型获得最佳性能
解锁多个生态系统
在开源社区扩大影响力
使用任何来源的数据pipeline

不过即便如此，像Cohere机器学习总监Nils Reimers也给Keras敲了个警钟：

希望历史不要重演。

Reimers认为，Keras最初从支持单个后端（Theano）开始，陆续添加了Tensorflow、MXNet和CNTK等多后端。

这引发了一系列问题：

某些功能只在特定后端可用
各个后端的计算结果存在不一致：在一个后端上运行正常的代码，在另一个后端可能产生不同结果
对于开源软件开发者来说体验糟糕：你刚完成了一个自定义的 Keras层想要分享？你是否愿意为其他后端重新实现和优化它呢？
调试问题：代码在一个后端上表现完美，但在另一个后端的最新版本上却频繁出错…

随着时间推移，这些问题愈发严重：某些模块只能在 Theano 上运行良好，某些只适用于Tensorflow，还有一些模块可以在MXNet上进行推理，但无法训练…

我希望这一次的多后端能有更好的表现，但这无疑仍是一个挑战。

80后法国AI大牛

提到Keras之父，François Chollet这个名字在AI圈里可以说是家喻户晓。

他出生于1989年10月20日，从履历上来看，他在2012年取得巴黎综合理工学院工程硕士学位之后，并没有选择继续深造，而是前往美国就职。

François先后分别在FreshPlanet和Thunder分别担任软件工程师和机器学习架构师；最后于2015年加入谷歌，直至今天。

在与国外知名访谈博主Lex Fridman交流过程中，François也回顾了Keras诞生的故事。

在2014年，那时候最受欢迎的深度学习库还是用C++编写的Caffe（贾扬清出品），当时Caffe要比Theano更受欢迎。

而到了年底，François突然对循环神经网络产生了浓厚的兴趣。

当时，这还是一个相对小众的领域，于是他便开始寻找适合的工具进行探索。

在参与Kaggle比赛期间，François尝试了诸如Torch7和Theano等工具，也使用过Caffe，但当时Caffe并没有提供理想的循环神经网络解决方案，例如缺少可重复使用的开源LSTM实现。

于是乎，François便有了一个想法，自己动手构建一个框架。

他最初的想法是主要集中在LSTM和RNN的实现上，且使用Python来编写。

期间一个非常重要的决定是——模型将通过Python代码来定义。

这可以说是与当时的主流想法是背道而驰，因为像Caffe、Theano这样的库通常使用YAML等静态配置文件来定义模型。

但其实有些库是用代码定义模型的，例如Torch7（但不是Python）。

而在François此前的工作实践中，scikit-learn这个开源深度学习库深得他的心意，因此他从中获取了大量的灵感。

用他的话来说就是，Keras几乎就是为神经网络打造的scikit-learn。

有意思的是，Keras这个名字，还是François他在发布当天临时定下来的。

并且François还坦言：

几个月后我加入谷歌，其实跟Keras没有任何关系。
我当时加入了一个研究团队，专注于图像分类和计算机视觉领域，因此最初在谷歌的工作主要是进行计算机视觉研究。
刚加入谷歌时，我接触到了TensorFlow的早期内部版本，它吸引我的原因在于它是Theano的改进版。那一刻，我就意识到必须把Keras移植到这个全新的TensorFlow上。

而后，也就是有了Keras与TensorFlow集成的故事。

至于除了这次离职的动作之外，François上一次步入大众的视频，还是一次访谈。

在这次访谈中，他表示打算用100万美元搞AGI竞赛。

至于原因，是因为他觉得现有的AI技术，尤其是LLM，主要依赖于记忆和模仿人类数据中的模式，在新情境下的新推理和技能获取方面表现不佳。

其实早在2019年，François就提出了ARC-AGI ——唯一衡量AGI能否有效获取新技能并解决开放式问题的评估标准。

目前，最好的AI系统在ARC基准测试中的得分为34%，而人类包括儿童在内均能轻松得分85%。

因此ARC Prize鼓励开源合作，以提高新想法的产生率，增加发现AGI的机会，并确保这些新想法得到广泛传播。

至于François下一步的动向，量子位也将继续保持关注。

参考链接：
[1]https://developers.googleblog.com/en/farewell-and-thank-you-for-the-continued-partnership-francois-chollet/
[2]https://news.ycombinator.com/item?id=42130881
[3]https://time.com/7012823/francois-chollet/
[4]https://en.wikipedia.org/wiki/Fran%C3%A7ois_Chollet
[5]https://www.linkedin.com/in/fchollet/
[6]https://keras.io/keras_3/

— 完 —

报名即将截止！

「2024人工智能年度评选」

量子位2024人工智能年度评选将于11月15日截止报名，评选从企业、人物、产品三大维度设立了5类奖项。

欢迎扫码报名评选！评选结果将于12月MEET2025智能未来大会公布，期待与数百万从业者共同见证荣誉时刻。

点这里👇关注我，记得标星哦～

一键三连「点赞」、「分享」和「在看」

科技前沿进展日日相见 ~

http://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==&mid=2247758215&idx=1&sn=e45938783b41eef930ab12c957b51b68

量子位

追踪人工智能新趋势，关注科技行业新突破

最新文章

“清华AI医院”上线！首批42位AI医生亮相，诊断覆盖300余种疾病

国产4o大模型，秒懂国风李子柒

人生搜索引擎免费用，开源版哈利波特“冥想盆”登GitHub热榜，支持中文

iPad可用AI绘画交互编辑神器火了，网友：颤抖吧PS

多样任务真实数据，大模型在线购物基准Shopping MMLU开源｜NeurIPS&KDD Cup 2024

定档12月11日，MEET2025智能未来大会报名通道已开启！

刚刚，星舰第六次试验成功！猛禽发动机实现“太空重启”，降落过程大秀身姿

2499，AI浓度爆表！戴上这副眼镜，一句话点咖啡/实时翻译/AR导航全搞定

特斯联首款通用智能体发布，实现对物理世界的高维感知

港科大具身机器人团队，连续获亿级融资

ChatGPT付费功能免费用！Mistral把Canvas、Artifact全复制了

Qwen2.5更新百万超长上下文，推理速度4.3倍加速，网友：RAG要过时了

AI自动操作VS Code，自然语言搞定各种配置，来自阿里通义智能计算实验室 | 开源

定档12月11日，MEET2025智能未来大会报名通道已开启！

腾讯AI大牛，被曝投身视频生成创业

北大等发布多模态版o1！首个慢思考VLM将开源，视觉推理超越闭源模型

猫猫运动方程，首次被物理学家破解！ |《美国物理学杂志》正经研究

如祺出行跑进智驾深水区 “数据闭环”为技术迭代提供更优解

智能交互创新赛落幕，哈工大AI智能背诵助手拿下特等奖｜OPPO智能体平台

AI能办专属信用卡了，Agent自己赚钱自己花，OpenAI合作伙伴打造

AI一键解析九大生物医学成像模式，用户只需文字prompt交互，微软UW等新研究登Nature Methods

定档12月11日，MEET2025智能未来大会报名通道已开启！

ChatGPT击败50名人类医生！疾病诊断准确率达90%，OpenAI总裁：人机合作还得加强

打破纪录！中国科学家让薛定谔的猫活了23分钟

视频大模型无损提速：删除多余token，训练时间减少30%，帧率越高效果越好 | NeurIPS

实测腾讯元宝2.0：图文视频啥都能搜，论文绘画全搞定

杨植麟发布Kimi新模型：数学对标o1，中考高考考研成绩全第一

航展附近这场无人机编队表演，竟用了钉钉AI助理出的方案

量化能让大模型“恢复记忆”，删掉的隐私版权内容全回来了，SU哈佛亚马逊最新研究引热议

不做Sora背后：百度的多模态路线是什么？

马斯克新官上任再起诉OpenAI！新证据称Ilya七年前就不放心奥特曼了

人大&港科大揭示大模型重要安全风险漏洞：利用概念激活向量破解大模型的安全对齐｜NeurIPS 2024

多个中国团队斩获EMNLP'24最佳论文！UCLA华人学者中三篇杰出论文，明年顶会落户苏州

谷歌杀回来了！新版Gemini跑分超o1登顶第一，CEO：这才哪到哪儿

ChatGPT深夜更新：Mac版支持“读屏编程”，Windows版全员可用了

AI在《我的世界》PK盖楼，新旧Claude差距过于明显，网友：审美也是智力的一种

最后1天！2024人工智能年度评选，AI时代的行业先锋就等你来

大模型上了火山方舟：数据唯你可见，唯你所用，唯你所有

李飞飞吴佳俊团队新作：推出具身智能决策能力评价基准，o1-preview登顶 | NeurIPS

Scaling Law遭遇瓶颈，OpenAI被曝押注智能体“Operator”

Meta最新触觉机械手登Science子刊封面，操作未知物体精度最高提升94%

大模型“取长补短”新思路入选NeurIPS'24，显著优于现有路由方法，南科大港科大出品

最后2天！2024人工智能年度评选，AI时代的行业先锋就等你来

把Runway、Luma们一锅端了！这款视频模型上“杀手级”功能：一致性魔咒终于打破

Keras之父，离职谷歌

百度打通两大国民产品！六边形AI创作新物种「自由画布」来了

小度为何押注AI眼镜？

今日最热论文：Scaling Law后继乏力，量化也不管用，AI大佬齐刷刷附议

稚晖君后宇树也来玩开源了：机器人操作数据集，采用抱抱脸LeRobot训练测试，网友：泰裤辣！

最后3天！2024人工智能年度评选，AI时代的行业先锋就等你来

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

Keras之父，离职谷歌

金磊 发自 凹非寺量子位 | 公众号 QbitAI

Keras：为人类设计的深度学习

80后法国AI大牛

金磊发自凹非寺
量子位 | 公众号 QbitAI