深势科技张林峰、柯国霖连续入选“斯坦福全球前2%顶尖科学家名录” 领衔深耕AI for Science基础设施建设

文摘   科学   2024-10-11 17:18   北京  




2024年9月16日,美国斯坦福大学 John P.A.Ioannidis 教授团队发布了全球前2%顶尖科学家榜单第7版,从全球近700万名科学家中遴选出各领域的世界排名前2%的科学家,覆盖22个领域和174个子学科领域。

深势科技创始人兼首席科学家张林峰,深势科技机器学习算法负责人柯国霖入选2024年度名录,两人从2022年起连续三年入选,排名逐年大幅提升。

据悉,榜单基于 Scopus 数据库,涵盖了 SSCI、SCI、EI期刊、EI会议的论文等,通过论文被引次数、h指数、hm指数等进行综合评估,以直观的数据对各领域科学家工作的肯定。

此外,2024年的榜单还增加了被撤论文的数据以及被撤论文的引用/自引用情况,以提供更全面的评估。
林峰和国霖的上榜,是对两人多年深耕 AI for Science 的肯定,也是对二人带领下的深势科技团队取得的丰厚成果的认可。
林峰作为深势科技创始人兼首席科学家,先后获得北京大学理学学士及普林斯顿大学应用数学博士学位。林峰长期致力于 AI for Science 跨学科领域的问题研究,在机器学习、计算物理化学、材料与药物设计等领域成果丰富,发表于《自然 Nature》、《美国科学院院刊 PNAS》、《物理评论快报 PRL》等学术顶刊,以及APS March、AlChE、ACM/IEEE Supercomputing、NeurIPS、ICLR 等学术和 AI 顶会,并登上斯坦福大学发布的“全球前2%顶级科学家名录”。张林峰作为核心开发者,领导开发了深度势能 DeePMDDeePKSDeePWF、DeePCG 等一系列微尺度仿真算法及相应开源软件。2020年,DeePMD 获得高性能计算领域最高奖 ACM 戈登贝尔奖,该成果也入选了由两院院士评选的2020年度中国十大科技进展。作为深势科技的创始人兼首席科学家,张林峰带领团队与协作者共同发展了 Reinforced Dynamics/Uni-Mol/Uni-Fold/Uni-FEP 等算法和预训练大模型。此外,张林峰着力参与和推动 AI for Science 领域最大的开源社区 DeepModeling 的发展和壮大,领导社区基础设施建设、项目协同开发等。其中,OpenLAM 大原子模型计划诚邀到了全球数十个顶级高校共建,并包括多位诺奖得主、中美两院院士、顶尖技术专家组成顾问团,先期成果被人民日报、新华社和央视多次报道。此外,林峰因其对 AI for Science 和智能计算应用的卓越贡献,荣获包括福布斯亚洲U30封面人物、DeepTech 中国智能计算科技创新人物、财富中国40位商界精英在内的众多奖项认可。
作为深势科技合伙人、AI高级副总裁,国霖目前在深势科技负责人工智能与机器学习的算法研究和应用开发,曾任微软亚洲研究院(MSRA)机器学习组高级研究员,在 NeurIPS,ICLR,ICML 等顶级会议发表了数十篇论文。
特别值得注意的是,国霖的代表性工作之一是 LightGBM,一个高效的分布式决策树算法工具。LightGBM 因其卓越的性能,被广泛应用于金融、广告、推荐系统等预测建模任务。其开源代码在 GitHub 上获得约16,000颗星标,下载量超3.7亿次,相关论文累计引用约14,000次,并被评为“AI100: Top 100 AI Achievements (1943-2021)”之一。
近年来,国霖专注于 AI for Science 领域的研究,在多个关键应用场景中取得了一系列重要成果,包括蛋白质结构预测、三维小分子药物表征建模与生成、实验表征解析以及科学文献理解等。他的代表性成果包括 Uni-Fold,即国内首个复现 AlphaFold2 的工作,在开源社区取得了广泛的影响;并且进一步推出了更具广泛应用场景,包括表现更佳的 Uni-Fold Multimer 和 Uni-Fold Symmetry 等版本。
在三维分子建模方面,国霖带领团队推出了 Uni-Mol,首个通用的三维分子表征模型,及其衍生的领域应用案例,如 Uni-MOF、Uni-QSAR、Uni-Mol Docking 等。此外,他还多次在国际竞赛中斩获佳绩,包括2021年 KDD CUP 冠军和2021年 NeurIPS Open Catalyst 冠军。
在今年发布的全球前2%顶尖科学家榜单第7版中,作为 AI for Science 概念的提出者,中国科学院院士、北京科学智能研究院理事长、北京大学国际机器学习研究中心主任、深势科技首席科学顾问鄂维南荣登此榜单的“终身科学影响力排行榜”和“年度科学影响力排行榜”。
榜单完整信息:https://elsevier.digitalcommonsdata.com/datasets/btchxktzyw/6

One more thing......

科学家+实践家推动 AI for Science 进阶

当地时间10月8日,瑞典皇家科学院决定将2024年诺贝尔物理学奖授予约翰·J·霍普菲尔德( John J. Hopfield )和杰弗里·E·欣顿( Geoffrey E. Hinton ),表彰他们在使用人工神经网络进行机器学习的基础性发现和发明。9日,诺贝尔化学奖花落大卫·贝克( David Baker ),戴密斯·哈萨比斯( Demis Hassabis )和约翰·M·詹伯( John M. Jumper ),以表彰他们在“计算蛋白质设计”及在“蛋白质结构预测”方面的贡献。
今年的诺贝尔物理学奖不仅是对两名科学家成就的肯定,更是极大强调了跨学科研究的重要性,向人们展示了物理学的深刻洞见与计算机科学创新“碰撞”可以产生的巨大能量。
当前人们谈论人工智能时,经常指的是使用人工神经网络的机器学习。诺贝尔物理学委员会秘书乌尔夫·丹尼尔松强调,人工神经网络在物理学中的研究和应用已经持续了相当长一段时间,本次诺贝尔物理学奖并非颁发给过去几年人工智能的发展,不是针对大语言模型或类似的东西,而是针对基础发明。
远在人工智能成为今天的科技热词之前,这两名科学家从20世纪80年代起就在人工神经网络领域做出了重要工作。这项技术最初的灵感来自大脑的结构。就像大脑中大量神经元通过突触相连一样,人工神经网络由大量的“节点”通过“连接”组成。每个节点就像一个神经元,而连接的强弱则类似于突触的强度,决定了信息传递的效果。
一天后,物理学界的震惊还未平息,诺贝尔化学奖又再次将荣誉授予了 AI 领域。
事实上,David Baker 成功完成了几乎不可能完成的壮举,制造出了全新种类的蛋白质。Hassabis 和 Jumper 则开发了一种人工智能模型来解决一个 50 年前就存在的问题:预测蛋白质的复杂结构。
诺贝尔奖委员会评价称:David Baker 的贡献在于他让蛋白质设计从实验室的试管,搬进了计算机的虚拟世界。Baker 的“魔法”在于通过计算机模拟氨基酸的相互作用,推导出最稳定、最有效的蛋白质折叠结构。David Baker 和他的研究小组不断创造出一个又一个富有想象力的蛋白质,并证明能被用于药物、疫苗、纳米材料和微型传感器,应用前景广阔。
想象一下,蛋白质就像是生物界的乐高积木,而以前我们只能凭运气和经验拼接这些积木。Baker 的计算工具则为我们提供了自动拼接的能力,不仅可以迅速组装,还能按照我们的意图设计全新的积木形状。AI 已经为科学进步做出了巨大的贡献,未来在 AI 的帮助下蛋白质设计可以更好地为人类服务。
对 Demis Hassabis 和 John M. Jumper 的评价是:他们开发了一种名为 AlphaFold2 的人工智能模型,它解决了一个已有50年历史的难题,能够预测大约两亿种已知蛋白质的复杂结构,并且已被全球200多万人使用。
值得关注的是,戴密斯·哈萨比斯( Demis Hassabis )和约翰·M·詹伯( John M. Jumper )均就职于谷歌旗下的前沿 AI 企业 DeepMind,前者是 DeepMind 的 CEO,后者则是高级研究科学家。二人带队在2023年开发的AI模型 AlphaFold,基于深度学习和神经网络技术的算法,不仅预测了蛋白质的三维结构,还成为所有蛋白质结构研究中的关键工具。我们为 DeepMind 取得的成绩感到高兴,也是为 AI for Science 被更广泛的群体认可和应用感到倍受激励。

中国版 AlphaFold 实力不容小觑

作为 AI for Science 领域的先行者和践行者,深势科技致力于运用 AI 学习一系列的科学原理和科学知识,并进一步解决科学研究和工业研发领域的关键问题。依托在交叉学科领域的深耕,构建了“深势 · 宇知®” AI for Science 大模型体系,将众多学科的科研方法从“实验试错 / 计算机”时代带入了“预训练模型时代”,并以“微尺度工业设计与仿真”为切入点,打造了 Bohrium® 玻尔科研空间站、 Hermite® 药物计算设计平台、RiDYMO® 难成药靶标研发平台及 Piloteye® 电池设计自动化平台等科研和工业研发基础设施,形成了 AI for Science 的“创新 - 落地”链路和开放生态,赋能“千行百业”,为人类经济发展最基础的生物医药、能源、材料和信息科学与工程研究打造新一代工业设计与仿真系统。
特别值得注意的是,在林峰和国霖的带领下,深势科技在2021年就推出了 Uni-Fold,将最新注意力机制加速技术 Flash-Attention 与 Uni-Fold 深度结合,进一步优化了模型的显存利用计算效率优化后,Uni-Fold 端到端训练速度再增18%( http://www.bibdr.org/nd.jsp?id=279&groupId=-1 ),将现有蛋白折叠模型( Jumper et al, 2021 )的端到端训练时间由11天降至4天此外,该技术大幅降低了模型推理的显存需求,在不使用模型并行与分块计算技术时,支持的最大序列长度增至2倍相关实现已开源至深势科技 Github 仓库。

2023年11月,深势科技发布了 Uni-Mol Docking v2,其性能超越了 DeepMind 于2023年10月底发布的 AlphaFold-latest。在 PoseBuster 数据集上,Uni-Mol Docking v2 的预测精度达77.6%,生成的分子构象更加合理,确保了几何形态和手性关系的准确性。2024年5月,该模型被作为实验基线,列入 AlphaFold3 的官方 Nature 论文中,表现仅次于 AlphaFold3,且差距微小。

此前,深势科技于2022年5月发布的 Uni-Mol 就备受关注,它是一款基于分子三维结构的通用分子表征学习框架,论文被机器学习顶会 ICLR 2023 接收。Uni-Mol 性能优越、模型泛化能力强,在小分子性质预测、蛋白靶点预测和蛋白-配体复合物构象预测等任务上都超越之前方法。Uni-Mol 被应用于深势科技的多个产品中,也获得了大量学界和业界研究人员的广泛关注。同时,我们成功把 Uni-Mol 应用在了例如材料设计等更多领域,并取得了优异成果。后续,我们又对 Uni-Mol 的模型框架进行了大幅升级,推出了 Uni-Mol+,提高了量化属性的预测能力。Uni-Mol+ 论文被国际期刊《 Nature Communications 》接收,并在国际权威学术竞赛 OGB-LSC 的量子化学性质预测上获得了榜首。

结语:今年的诺贝尔物理学奖和化学奖颁给 AI 领域的科学家,不仅是对他们卓越贡献的肯定,更是对科学界的一次深刻启示:在未来的科学探索中,技术与学科的交叉融合将成为常态,而 AI 作为这一融合过程中的核心驱动力之一,将推动科学研究不断突破传统框架,实现更加深远、更加广泛的创新。
正如鄂维南院士所说:“我们正站在一场科学变革的起点,AI for Science 就是一个革命性的机会。它可以激发一场新的科学革命,重塑很多传统产业和科研模式,建立新业态,这样的机会我们应该去掌握,并且尽快抓住。”

关于深势科技

深势科技是“AI for Science”科学研究范式的引领者和践行者。AI for Science 即运用 AI 学习一系列的科学原理和科学知识,并进一步解决科学研究和工业研发领域的关键问题。

深势科技依托在交叉学科领域的深耕,构建了“深势 · 宇知®”AI for Science 大模型体系,将众多学科的科研方法从“实验试错/计算机”时代带入了“预训练模型时代”,并以“微尺度工业设计与仿真”为切入点,打造了 Bohrium® 玻尔®科研空间站、Hermite® 药物计算设计平台、RiDYMO® 难成药靶标研发平台及 Piloteye® 电池设计自动化平台等科研和工业研发基础设施,形成了 AI for Science 的“创新-落地”链路和开放生态,赋能“千行百业”,为人类经济发展最基础的生物医药、能源、材料和信息科学与工程研究打造新一代工业设计与仿真系统。

深势科技是国家高新技术企业、国家专精特新“小巨人”企业,在北京、上海、深圳等城市布局研发中心。科研技术团队由中国科学院院士领衔,汇集了超百位数学、物理、化学、生物、材料、计算机等多个领域的优秀青年科学家和工程师,其中博士及博士后在公司成员中占比超过35%。核心成员获得过2020年全球高性能计算领域的最高奖项“戈登贝尔奖”,相关工作入选2020年中国十大科技进展和全球 AI 领域十大技术突破。



深势科技 DP Technology
深势科技致力于运用人工智能和多尺度的模拟仿真算法,为人类文明最基础的生物医药、能源、材料和信息科学与工程研究打造新一代微尺度工业设计和仿真平台。
 最新文章