为什么诺贝尔化学奖又被人工智能学者拿了：阿尔法折叠，蛋白质结构预测易手

学术 2024-10-10 22:44 浙江

今天诺贝尔化学奖开奖，三位得奖者均是因为对蛋白质的杰出贡献获奖，其中华盛顿大学西雅图分校的 David Baker是因为 “计算蛋白质设计”，另后两位是英国伦敦 Google DeepMind 的 Demis Hassabis 和John M. Jumper在“蛋白质结构预测”的贡献。‍‍‍‍‍‍‍‍‍

我在昨天聊诺贝尔奖物理学奖的文章最后一段做了一个预言：‍‍‍‍‍‍‍‍‍‍

从今年诺贝尔物理学奖的得奖情况，和人工智能近年来对几乎全学科、所有领域的融入程度来看，也许，未来学好人工智能，很有可能会比拒绝人工智能的人，能更有效的工作、生活、形成新的重要发现，甚至争夺各个方向的诺贝尔奖。‍

没想到第二天这个预言就成真了。下面我来聊聊蛋白质结构预测，也就是Alpha系列中的AlphaFold子系列。

生命科学在2018年左右开始的发展，由于有人工智能的助力，备受瞩目，主要是因为最近有个明星级的产品，AlphaFold阿尔法折叠系列。它能从蛋白质的一级结构，即氨基酸序列的组合，来预判1）蛋白质的二级结构，即蛋白质分子中某一段肽链的局部空间结构；2）三级结构，即在二级结构基础上多段进一步折叠盘绕后形成的特定空间结构；3）四级结构，即蛋白质-蛋白质复合形成的结构，是更为复杂的生物大分子。AlphaFold系列对蛋白质结构与功能的预测，有望对人类在生命演化中的研究产生颠覆性影响。

蛋白质是由20种不同的氨基酸按特定序列连接形成的多聚体，要发挥生物学的功能，蛋白质通常会折叠成某一个特定的形状。早在1970年，其折叠的机理就被诺贝尔奖得主克里斯蒂安·安芬森以假说的形式提出，即在环境条件适宜时，蛋白质折叠后的稳定三维结构完全由组成它的氨基酸序列确定。这些折叠后的蛋白质就像我们平时开门用的钥匙和锁，有各自的功能表达。有的蛋白质能帮助维持新陈代谢，有的能提供能量，有的可以修复组织，有些能控制身体的体液平衡。

尽管有安芬森假说(Anfisen’s Dogma)，以往要预测蛋白质的结构，需要依赖生物方面的检测。一级结构比较容易确定，简单的生物实验如质谱法即可。但涉及到二级以上结构如何折叠的，结构生物学家往往需要利用X射线、核磁共振、电游仪、冷冻电镜来检测。这些方法耗时耗力、人工成本也极高，比如电泳仪只能间接进行测量，实验中还受较多因素干扰，因而会影响对蛋白质结构的分析与理解。而能高分辨率解析的冷冻电镜则极为昂贵，一台约1亿人民币左右，我国至2024年已拥有超过60台。

2020年DeepMind公司推出的阿尔法折叠（AlphaFold），则避免了这些不足。一开始，它将组成蛋白质的一级结构（氨基酸序列）视为一个能反映序列特性的马尔可夫链模型，同时补充相关的信息如氨基酸序列标号及各氨基酸之间位置和角度的特征等，通过深度学习模型来预测蛋白质更高结构的信息。在与已知蛋白质高阶结构进行比较后，反复迭代多次地调整深度学习模型的参数，最后获得最优的预测模型，输出蛋白质的空间位置和每组氨基酸的角度信息，从而实现对蛋白质空间结构的预测。

从AlphaFold到2024年5月提出的AlphaFold3，时间并不长，但却让蛋白质的结构预测能力从二级结构预测提升到了四级结构预测。由于深度学习能海量、高效解析蛋白质的结构，它大幅度降低了蛋白质结构的难度、人力和财力成本，使得大多数蛋白质结构的预测变得简单快捷，仅留少量仍需通过实验来探索。

它的意义在于，生命科学家们今后可以将重心从蛋白质结构的预测，转到蛋白质的功能预测上。这对于探索人类和其他生物的生命密码尤其重要。

当然，AlphaFold系统还存在不少不足，并不能完全取代生命科学家。而且生命科学也远不止蛋白质功能预测这么简单，还有相当多的任务需要完成。其中不少内容无法进行海量标注，也无法将其纳入到当下流行的大模型框架，尤其是复杂的生物关系网。

这也是为什么近年来，人工智能研究者开始强调，今后若干年可以发力的一个方向是AI for Science，缩写为AI4S，而其中的重心便是生命科学。

张军平

2024年10月9日

张军平，复旦大学计算机科学技术学院教授、博士生导师，中国自动化学会普及工作委员会主任。研究方向包括人工智能、图像处理、生物认证、智能交通等。连续四年（2021-2024）入选全球前2%顶尖科学家榜单终身科学影响力排行榜。发表论文200余篇，包括IEEE TPAMI 5篇，学术谷歌引用9000余次，H指数44。著有《人工智能极简史》《爱犯错的智能体》《高质量读研》。其中《人工智能极简史》2024年获第19届文津图书奖提名图书（科普类）和清华大学2024暑期推荐阅读书目。《爱犯错的智能体》2020年获中国科普创作领域最高奖（即中国科普作家协会第六届优秀科普图书金奖）等多个奖项。

本文经授权转自"平猫的音乐"微信公众号。

加关注 ID: fitee_cae

本公众号为中国工程院院刊《信息与电子工程前沿（英文）》（SCI-E、EI检索期刊）官方微信，功能包括：传播期刊的学术文章；为刊物关联学人（读者、作者、评审人、编委，等）提供便捷服务；发布学术写作、评审、编辑、出版等相关资讯；介绍信息与电子工程领域学术人物、学术思想、学术成果，展示该领域科学研究前沿进展；为该领域海内外学者提供友好互动平台。

http://mp.weixin.qq.com/s?__biz=MzUxOTcyNjQzNA==&mid=2247534239&idx=1&sn=5178ed74bb0f912981c8afdd21504471

信息与电子工程前沿FITEE

传播中国工程院院刊《信息与电子工程前沿（英文）》（FITEE）的学术文章；为FITEE关联人群（作者、读者等）提供便捷服务；提供学术写作、出版等相关资讯；介绍信息与电子工程领域学术人物、学术思想、学术成果，展示该领域科学研究前沿进展。

最新文章

简讯 | 中新工程院联合主办首期研讨会，共话人工智能前沿与治理

CCF隆重颁发四大奖项——王选奖、海外科技人物奖、青年科技奖、科技成果奖

2025年光纤国重（上海实验区）开放课题基金申请书及申请指南

智控实验室2024年度开放基金申报公告

决赛入围名单公布 | 欢迎莅临“钱塘信息杯”2024智能超表面技术创新应用大赛

华中科技大学智慧健康研究院开放课题申报通知

会议议程更新 | 欢迎莅临第三届智能超表面技术论坛

2024年中国高校产学研创新基金—数智创新与人才专项申请指南

广东省科技厅关于发布2025年度粤澳科技创新联合资助专题申报指南的通知

CNCC | CCF-腾讯犀牛鸟基金青年学术交流会

中国电子学会区块链分会—星火多维全连接实验室（星火i² Labs）开放课题申报通知

关于发布上海市2024年度“科技创新行动计划”技术标准项目申报指南的通知

FITEE｜黄梓煊、王焕清等 | 具有时变非对称约束的不确定非线性系统实际固定时间自适应模糊控制：一种基于统一障碍函数的方法

关于征集2025年度北京市自然科学基金-小米创新联合基金指南需求的通知

特种发光科学与技术重点实验室2024年度开放课题申请指南

FITEE｜深圳大学何玉林、路璇等：一种用于不平衡学习分类的新型交叠最小化SMOTE算法

国家自然科学基金委员会信息科学部2024年度专项项目（科技活动项目）申请指南

浙江理工大学计算机科学与技术学院（人工智能学院）2025年硕士研究生招生简介

FITEE｜辽宁师范大学周梓怡、石慧等：基于加性秘密共享和智能预测器自适应联合编码的密文图像可逆信息隐藏

2025年度航空航天结构力学及控制全国重点实验室开放课题申请通知

课题发布｜智慧计算集成电路关键技术公开研究课题开始申报

FITEE｜浙江大学丁王辉、刘佐珠等：基于深度学习的口腔三维扫描中六方位自由度牙齿姿态准确估算

开放报名 | 欢迎莅临2024“钱塘信息杯”全国智能超表面技术创新应用大赛决赛

机器智能与系统控制教育部重点实验室2024年度开放课题申请指南

为什么诺贝尔化学奖又被人工智能学者拿了：阿尔法折叠，蛋白质结构预测易手

FITEE｜哈尔滨工程大学彭锐晖、赖杰等：基于多模态图像输入端像素级融合的伪装目标检测

开放报名 | 欢迎莅临第三届智能超表面技术论坛

2024年诺贝尔物理奖官方解读：他们用物理解码信息

为何今年诺贝尔物理学奖颁给两位人工智能学者？谈人工智能的历史变迁及对人类社会的影响

FITEE｜电子科大武丹丹、西北工大陈捷等 | OntoCSD：基于本体的网络空间防御综合解决方案安全模型

第四届智能计算创新会议倒计时(内含最新议程）

关于发布2025年度湖北省自然科学基金创新发展联合基金项目申报指南的通知

FITEE | 中国科学院许驰、于海斌等 | 面向智能制造的工业互联网：过去、现在与未来

重大科学仪器设备研发重点专项2024项目申报指南

光电融合集成与通信感知教育部重点实验室2024年开放基金申请指南

FITEE｜浙江大学何欣莹、马耀光等：微纳光纤在超快光学领域的研究进展

2024年“CCF杰出工程师奖”评选结果公告

关于印发2024年度河北省省级科技计划创新联合体专项项目申报指南的通知

FITEE 2024年第9期摘要

关于发布“人类认知过程的计算神经机制”专项2024年度项目指南的通告

陆空基信息感知与控制全国重点实验室2024年度实验室基金项目及稳定支持项目申报指南

重磅报告嘉宾！之江实验室第四届智能计算创新会议即将开启

2024年CAAI-联想蓝天科研基金项目征集正式启动

关于发布上海市2024年度“科技创新行动计划”6G前沿技术领域项目申报指南的通知

自主智能无人系统全国重点实验室2024年度开放课题申请指南

天基网络与通信全国重点实验室2024年开放基金项目指南

RISTA前沿大讲堂 | 华南理工大学唐杰教授 | 智能反射面辅助通信网络：端到端传输模型与系统优化

2024年度“CCF海外科技人物奖”评选结果公告

计量与校准技术重点实验室开放研究基金课题指南

关于征集工信部重点实验室2024—2025年度开放课题的通知

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉