北大李志远组合作eLife 铁载体基因序列到化学结构解析

学术 2024-10-12 08:47 日本

2024年10月1日，由北京大学定量生物学中心/北大-清华生命科学联合中心李志远课题组牵头，联合南京农业大学LorMe实验室和苏黎世大学定量生物医学系Rolf Kümmerli教授在国际学术期刊eLife上发表了题为“From sequence to molecules: Feature sequence-based genome mining uncovers the hidden diversity of bacterial siderophore pathways”的研究论文。论文开发出了一种创新的生物信息学流程，成功揭示了假单胞菌铁载体pyoverdine途径的隐藏多样性，为细菌次级代谢的研究提供了全新的研究范式。

图1 从序列到分子：揭示铁载体通路的多样性

导读

微生物次级代谢产物在菌群互作研究和药物发现中具有重要作用。近年来，随着高通量测序技术的飞速发展，科学家对微生物群落的理解得到了极大提升，尤其是在微生物多样性和生态功能方面的研究。然而，尽管已有许多生物信息学工具可以用于识别微生物基因组中的次级代谢产物合成基因簇，但要精确预测这些产物的具体结构和功能仍然面临诸多挑战。这主要是由于次级代谢途径通常由复杂的模块化酶系统主导，而这些酶的底物特异性及功能难以通过现有数据准确预测。

本研究开发了一种新的生物信息学流程，专注于预测铁载体pyoverdine这一模式次级代谢物，该流程基于改进的基因注释，并结合基于系统发育和特征序列的底物预测技术，能够从基因组片段中准确识别 pyoverdine 合成基因簇，准确预测其结构组成和识别其对应的受体基因。这一创新方法大幅提升了次级代谢产物预测的准确性，揭示了一个之前未被充分认知的代谢多样性，具备广泛的应用前景：不仅为微生物次级代谢的深入研究提供了有力工具，还为新药开发、微生物代谢工程等领域开辟了新的方向。

图2 本文开发的基因组挖掘流程，以精确预测假单胞菌属菌株产生的铁载体pyoverdine的生物合成、分子结构和受体摄取机制

主要结果

一、改进的注释流程揭示了pyoverdine合成基因的多样性

首先，本研究开发了一种改进的四步注释流程，用于准确注释假单胞菌的铁载体pyoverdine合成酶的基因簇，系统分析了9599个假单胞菌基因组的铁载体pyoverdine合成基因簇，最终去除重复基因组获得1664个pyoverdine生产者和264个非生产者，它们遍布所有主要的假单胞菌物种分支（图3）。

图3 改进的注释流程揭示了pyoverdine合成基因的多样性

二、以系统发育为重点的pyoverdine A结构域的底物预测

本研究的下一个目标是精确预测 1664个具有完整合成酶基因簇的菌株所产生的pyoverdine分子结构。首先，通过分析13种已知pyoverdine结构和非核糖体肽合成酶（NRPS），从中识别出101个有确定氨基酸底物对应的A结构域序列。通过特征序列提取和序列距离计算以及聚类方法选择优化了A结构域底物预测的精确性。然后，将1664个pyoverdine生产者包含的18292个A结构域与101个参考A结构域进行比较，基于特征序列距离开发了一种“以系统发育为中心”的预测算法确定每个查询A结构域的底物。最后，通过双盲的方式分别在两个实验室开展pyoverdine结构预测和结构解析实验。我们在北京大学对20株假单胞菌进行pyoverdine结构预测，同时合作者Rolf在苏黎世大学采用 UHPLC-HR-MS/MS 技术解析了这20株菌所产pyoverdine的真实结构。结果显示预测与观察的结构匹配率高达 94.4%（160个氨基酸中有151个准确分配）。相比传统方法 antiSMASH（58.8% 准确率），本研究开发的方法显著提高了结构预测的准确率。未匹配的9个氨基酸中，包括无法区分的赖氨酸和鸟氨酸，以及对于缬氨酸、瓜氨酸和组氨酸等未在参考集中出现的底物预测为“未知”，只有两种情况（0.8%）表示观察到的氨基酸和预测的氨基酸之间存在真正的不匹配。总而言之，本研究开发的以系统发育为中心的预测流程在预测pyoverdine肽结构和识别假单胞菌中的未知底物方面非常准确（图4）。

图4 pyoverdine合成酶组装线的以系统发育为重点的底物预测

三、Pyoverdine注释和预测流程在完整数据集中的应用

本研究利用上述pyoverdine合成基因注释和结构预测的生物信息学流程推导出了这1664个菌株产生的pyoverdine结构，预测产生了188种不同的pyoverdine结构（图5），其中仅37种结构曾有报道。这37种结构在大部分菌株中高度丰富（1103个菌株），而本研究在识别更多更罕见的pyoverdine变体方面非常强大。值得注意的是，pyoverdine结构的多样性与系统发育没有强相关性，表明不同物种间存在pyoverdine合成基因的频繁重组与水平基因转移。总体而言，本研究开发的生物信息学方法能够高精度地预测 pyoverdine结构，揭示了假单胞菌中铁载体的多样性和进化史，并发现了151种新的pyoverdine变体。

图5 pyoverdine结构多样性映射到1928个假单胞菌菌株的系统发育树上

四、基于序列区域的 FpvA 受体注释鉴定流程

本研究继续开发了一种基于关键序列的 FpvA 受体注释方法，用于在假单胞菌基因组中注释FpvA受体。FpvA是TonB依赖性受体，负责将铁-pyoverdine复合物转运到周质中。本研究利用多序列比对和pHMM计算得出FpvA和 FpvB受体的关键识别区域，命名为R1和R2。R1区域用于区分其他受体与FpvA、FpvB 受体，R2区域则区分FpvA和 FpvB受体。基于这些关键识别区域的评分，本研究开发了一个决策流程图来注释假单胞菌基因组中的FpvA受体（图6）。

图6 用于注释FpvA受体的基于序列区域的鉴定流程

五、Pyoverdine受体注释流程在完整数据集中的应用

将基于关键序列的受体注释流程应用于1928个假单胞菌基因组，成功识别出4547个FpvA、615个FpvB和9139个其他TonB依赖性Fpv受体（图7）。将4547个FpvA序列与已知FpvA序列进行序列相似性分析，其中2254个FpvA序列与已知参考序列相似性低于50%。进一步分析发现，92%的FpvA基因在基因组上位于其对应的pyoverdine 合成基因的20 kb范围内，验证了 FpvA 受体注释方法的可靠性。通过分析1534个位于pyoverdine 合成基因20 kb范围内的FpvA受体的序列特征，发现四个位于Plug结构域附近的区域对FpvA的分组识别能力最强。这些高分区域与pyoverdine选择性相关，并用于开发“特征序列”以增强序列聚类的准确性。应用特征序列识别出94组FpvA，其中43个组包含超过10个成员，显示出远超预期的受体多样性（94组中只有3组被报道）。

图7 将受体注释流程应用于1928个假单胞菌基因组

总结

本研究开发了一系列生物信息学注释流程，用于重建由假单胞菌产生的铁载体——pyoverdine的完整代谢途径。通过结合知识引导学习和基于特征序列的方法，该流程成功注释了pyoverdine的合成酶和受体，并准确预测了pyoverdine的结构组成。研究表明，基于完整基因序列的比对无法准确预测功能信息，提取与功能密切相关的特征序列更加有效。通过该方法，研究发现了许多新的 FpvA受体和pyoverdine。此外，本研究注释流程在基因组草稿数据中表现良好，并显示出扩展到其他微生物次级代谢产物的潜力。通过逐步改进算法和结合实验验证，可进一步提高预测精度，且自动化分析流程可应用于大规模次级代谢产物的研究。

该工作的第一作者为北京大学定量生物学中心/北大-清华生命科学联合中心的博士后顾少华和研究生邵远哲，通讯作者为南京农业大学的韦中教授，苏黎世大学定量生物医学系Rolf Kümmerli教授和北京大学定量生物学中心/北大-清华生命科学联合中心研究员李志远。相关工作得到了北大-清华生命科学联合中心，以及国家重点研发计划(2021YFF1200500)和国家自然科学基金委员会项目(42107140，41922053，32071255，T2321001)和博新计划(BX2021012)的资助。

论文信息

原名：From sequence to molecules: Feature sequence-based genome mining uncovers the hidden diversity of bacterial siderophore pathways

译名：从序列到分子：基于特征序列的基因组数据挖掘揭示了细菌铁载体通路的隐藏多样性

期刊：eLife

DOI：10.7554/eLife.96719.3

发表时间：2024.10.01

第一作者：顾少华、邵远哲

通讯作者：韦中、Rolf Kümmerli、李志远

通讯作者单位：南京农业大学、苏黎世大学、北京大学

转自：南农LorMe

http://mp.weixin.qq.com/s?__biz=MzIwMzg3MDk2MQ==&mid=2247515150&idx=2&sn=b4150588903ecc42e8ed41e44c687c1b

遇见生物合成

1）简述国内外合成生物学与天然产物生物合成相关研究进展，解读最新文献资讯；2）简述学术界那些事，偶尔情怀主义；3）化学与生物学的完美碰撞；4)高校与研究所那些事。

深圳先研院石一鸣组NPR封面｜自然“战场”启发活性分子的发现和改造

天工所吴信组在高效降解木质素的生物资源挖掘和代谢网络解析方面取得新进展

天津大学罗云孜组/上海药研所叶阳团队Nat Comm｜开发链霉菌内源I-E 型 CRISPR-Cas 系统用于天然产物的开发

浙江大学李永泉组ACS Synth. Biol 补骨脂酚在酵母中的从头合成

微生物研究所尹文兵团队Bioresource Technology | 受邀发表丝状真菌底盘开发研究进展综述

丹麦技术大学丁玲组Nat Com | 一种新型抗真菌分子Alligamycin A

PNAS | 定量解构肿瘤微环境：DeSide助力多种肿瘤内细胞丰度的精准预测

西湖大学王雅婕团队与孙立成团队合作开发生物电化学系统实现从CO2到C2+高附加物的合成

AlphaFlod3终开源

杨建明组Bioresource Technology｜通过优化蛋白合成和分泌途径优化将葡萄糖酸和CO2转化为α-淀粉酶

中科院过程所生物药制备与递送国重室陈瑶团队高薪诚聘合成生物学、生物催化等交叉科学博后

瞿旭东/张郑宇/王斌举合作PNAS｜揭示核碱基驱动催化复杂化学反应的新颖P450过氧化物酶

江大陈坚团周景文组Nat Rev Bioeng | 微生物细胞工厂：细胞培养肉低成本与高品质的驱动力

西湖大学张骊駻组Chem. Sci.｜模块型聚酮天然产物挖掘的代谢-基因组学策略

天工所郑平/王猛合作Trends in Biotech | 谷氨酸棒杆菌全基因组规模筛选工业生产相关渗透压/氨基酸产量等功能元件

NCB：CEMPS杨晟团队开发出能高效利用秸秆糖的酵母并成功商业化

神舟十八号从太空带回34.6公斤科学实验样品

上海有机所刘文组Nat Syn：一类新型Ⅱ型聚酮合成酶体系——打破40年来对II型PKSs延伸单元单一性认知

JNP新主编｜Dr Bradley Moore

西南大学邹懿组Angew｜明星分子(−)-Vinigrol的生物合成

ACS Catal｜医科院药物所訾佳辰与中大巫瑞波组解析狼毒大戟中半日花烷衍生型二萜药效物质的形成机制

JACS｜刘天罡/鲁丽团队揭示艾蒿中高效驱虫成分艾蒿醇

微生物所尹文兵/北大罗春雄合作Adv Sci|定量表征的真菌次级代谢相关基因调控回路助力新天然产物的发现

力闻｜力文所参与的蛋白质语言模型解释性工作于PNAS发表

专家点评Nature | 胡政/贺雄雷/何真团队合作揭示早期肿瘤从多克隆至单克隆转变的演化新模式

Cell子刊Joule｜天津大学李锋/宋浩团队：电遗传技术助力异丁醇电发酵接近理论产率！

Cell｜雷晓光/李毓龙/陈煜合作阐明胆汁淤积瘙痒分子机制，开辟肝病治疗新途径

北京大学林文翰/范爱丽组JACS｜基因组挖掘与生物合成研究助力真菌DMOA来源杂萜分子的高效定向发现

合成细胞国际联盟成立

中国科学院合成细胞国际科学计划启动

南大戈惠明/焦瑞华/史净合作JACS | 细菌来源新颖I/II型PKS杂合芳香聚酮的挖掘

西南大学牛国清组JAFC｜基于 tnaC的色氨酸生物传感器构建及其在紫色杆菌素动态合成中的应用

Chemical Reviews｜林世贤/张帅合作总结蛋白质脂化修饰的合成生物学研究

江南大学倪晔/许国超组Nat Comm｜机器学习增强羧酯酶的立体选择性发散进化

Nat Commun| 浙江大学医学院王健博团队联合暨南大学张志民、周洋团队解析糖基转移酶化学选择性机制及打造糖基化平台的研究

Nature Communications｜哺乳动物活细胞内可编程重构RNA调控网络的人工基因线路

江南大学聂尧组NPR综述文章｜天然产物合成中的Fe(II)和2-酮戊二酸依赖型双加氧酶：反应多样性的分子见解

山大方诩教授组Carbohyd Polym｜非粮生物质高效转化制备高纯度γ-环糊精

天津*第二届高级酶工程与酶技术应用大会

中国农大杨新玲组JAFC封面 | 从生态学角度创制绿色蚜虫行为控制剂，合理平衡分子的‘高效性’与‘安全性’

西南大学牛国清组ACS SynBio｜链霉菌鼠李糖诱导表达系统的创制与应用

浙工大郑裕国团队柳志强组ACS Catal | 改造羰基还原酶高效不对称生物合成手性芳香族邻氨基醇

Nat Commun｜中科院化学所敖宇飞/北师大申林合作建立酰胺水解酶立体选择性预测模型

北大李志远组合作eLife 铁载体基因序列到化学结构解析

Nat. Comm.｜表面展示酶的工程菌群催化半纤维素高效转化高值产品和电能

木质纤维素整合生物加工技术研究进展│Engineering Microbiology 综述

江南大学陈坚团队刘龙组ME｜脂滴中重构后角鲨烯途径实现酿酒酵母高效合成7-脱氢胆固醇

庐山植物园药用植物次生代谢研究组招聘（2024）

江南大学陈坚团队刘龙组ME｜脂滴中重构后角鲨烯途径实现酿酒酵母高效合成7-脱氢胆固醇

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉