合成生物学和基于计算机的抗菌肽框架发现

文化   科学   2024-07-23 08:30   江苏  



Synthetic Biology and Computer-Based Frameworks for Antimicrobial Peptide Discovery



DOI10.1021/acsnano.0c09509

杂志:American Chemical Society

OnlineFeb. 2021

通讯作者塞萨尔·德拉富恩特-努涅斯,宾夕法尼亚大学
文章链接https://doi.org/10.1021/acsnano.0c09509



研究背景



抗生素耐药性是我们社会中最大的医疗问题之一,目前,欧洲每年有超过25,000人死亡,美国每年有35,000人死亡。几十年来,抗微生物药物耐药微生物的数量一直在增长。这些病原体引起的感染缺乏有效的治疗方案,对经济产生了深远的影响以及我们的福祉。据估计,全球范围内这个问题的严重程度令人震惊,特别是在过去几十年中,抗生素一直没有被发现。因此,我们必须开发能够对抗多重耐药微生物的抗菌剂并减缓抗生素耐药性的演变和传播。

抗菌肽(AMP)基本上是由地球上所有生物体自然产生的并通过多种作用机制作为防御系统,抵御入侵的病原体。这些分子作为免疫系统的一部分已经进化了数十亿年并提供针对一系列病原微生物(包括细菌、真菌、病毒和寄生虫)的广谱保护。AMP 体积小(长度在 6 50 个氨基酸残基之间),并且具有两亲性和阳离子结构,由于存在 Lys Arg 残基,通常具有 +2 +9 之间的净正电荷。它们大约 50% 的一级结构由疏水性和脂肪族残基组成,这些残基能够与膜相互作用并易位到细胞中。由于其强大的抗菌活性、尺寸和物理化学特性,AMP 代表了用于工程的多功能支架,并已被广泛研究。然而,一些障碍,如毒性、有限的生物利用度、对病原体的特异性不足以及大规模生产的困难,阻碍了AMP作为治疗传染病的治疗剂的发展。然而,设计策略、合成方法和递送系统的最新进展正在改变将合成 AMP 转化为用于治疗耐药性感染的下一代标准护理抗生素的可能性。

这篇综述提供了最新的计算和合成生物学工具的最新信息,这些工具旨在推进AMP作为一代抗菌剂的应用,以帮助补充我们目前的抗生素库。



研究摘要




抗生素耐药性是我们这个时代面临的最大挑战之一。这一全球健康问题源于缺乏真正有效的抗生素类别,以及全球医院中多重耐药细菌分离株的发病率增加。事实上,最近据估计,到2050年,每年将有1000万人死于耐药性感染。因此,迫切需要制定开箱即用的策略来对抗抗生素耐药性。生物界提供了称为抗菌肽(AMP)的天然模板,它表现出多种内在的医学特性,包括靶向细菌。AMP可以用作支架,并且通过工程可以重新配置,以优化对耐药病原体的效力和靶向性。在这里,我们回顾了用于发现、设计和生产AMP的工具的最新发展,并提出肽药物发现的未来将涉及计算生物学和合成生物学原理的融合。


研究内容

研究内容一:非计算设计方法

传统的 AMP 设计方法依赖于不可推广的实验试错法。这些非计算方法能够产生高活性的 AMP,尽管缺乏标准化设计和实验方法的局限性,在大型数据集和适当的计算能力出现之前,这些条件占主导地位。下面,我们概述了迄今为止使用的最重要的策略。

通过添加、删除或替换氨基酸残基来突变天然肽有助于评估每个残基对任何给定肽模板的影响。通过比较肽功能如何受到疏水性、两亲性、净电荷和拓扑表面相关特性等特性的绝对值或平均值差异的影响,可以评估与肽活性相关的特征。其中一些生物学描述符很容易通过经验或简单的序列分析提取。然而,更复杂的描述符,例如从分子动力学和量子计算(例如,拓扑和能量参数)得出的描述符在过去的几十年里,已经使用生物信息学和计算工具进行了描述。

系统的单残基取代可以覆盖序列空间的很大一部分,是识别和表征物理化学和结构特性对生物活性影响的最直接的实验方法。进行系统氨基酸取代研究的两种主要方法是单突变肽文库,包括将所需的氨基酸残基(例如,Ala)引入肽序列中的每个位置,以阐明每个残基的功能,以及高通量筛选,其中合成和分析大量变体。使用扫描组合文库时,生成的变体数量取决于给定肽中存在的氨基酸的初始数量。例如,一个 12 聚体肽将呈现 20124.1 × 1015变化,这只是考虑到 20 种天然存在的经典氨基酸。然而,由于这种变化数量对于实验分析是不可行的,因此可以在序列中固定特定的残基,例如Ala,以生成组合文库。这些扫描用于旨在描述决定性热点及其对生物活性的影响的研究。作为扫描组合库有效性的一个例子,Torres 等人。报道了一种全面的物理化学指导方法,用于将有毒的α螺旋黄蜂毒液肽重编程为无毒抗生素。本研究系统地分析了每种氨基酸残基对结构和理化性质的贡献,从而实现了后续的结构引导设计,与模板毒素相比,产生了具有最小或没有细胞毒性和溶血活性的优化合成肽,并增加了抗菌功能。优化的AMP在体外和体内均对细菌和真菌具有活性。与野生型分子相比,对原始序列的修改导致更高的螺旋含量,导致抗菌活性增加。将平均疏水性值保持在特定热点范围内,同时尊重螺旋结构的两亲性平衡,导致细胞毒性的抑制。此外,插入模板肽的亲水面的正电荷降低了细胞毒性和溶血活性。

合成化学策略和路线的进步,加上具有不同正交性的几种保护基团的发展(图1A),使高通量合成(图1B)和更详细的SAR研究成为可能,用于含有非经典、约束类似物的肽,甚至是那些与其他分子(如脂质、有机化合物和纳米结构)偶联的肽。

1 AMP制造方法。(A AMP可以使用固相策略通过传统的化学合成来制造,但这些方法既费时又昂贵。(B)已经开发了高通量方法,以加快该过程并使其更便宜、更环保,从而可以探索AMP化学空间。(C)后期临床试验和商业生产需要大规模生产,合成生物学技术推动了这些过程,这些技术允许生物体表达肽。

固相肽合成(SPPS)允许将不寻常的氨基酸高产率和纯度掺入肽序列中。在改善AMP的策略中,用d-氨基酸对应物部分或完全取代l-氨基酸是一种方法这一直被证明可以改善关键功能参数,如肽活性,毒性和抗降解性在肽酶存在下。含有 d-氨基酸的 AMP 也被证明是有效的抗生物膜,抗癌抗寄生虫,抗真菌的和免疫调节肽。

通常,由 d-氨基酸(反肽)制成的 AMP 具有与具有相同序列的全 l-AMP 相似的物理化学和结构特性。这些相似性延伸到它们对细菌细胞的作用机制,特别是如果肽通过破坏细胞膜的稳定性或破坏细胞膜起作用,而不是具有特定的相互作用,例如与受体和蛋白质结合。对于结合和特异性相互作用,肽被设计成其逆向形式,这使得它们的物理化学和结构性质与它们的l-形式相比基本不变。

合成的非经典氨基酸在合成过程中可直接与肽序列偶联或偶联后转化;事实上,已经描述了多种翻译后修饰的氨基酸。有相当多的氨基酸衍生物负责缩小AMP的活性范围或将其转化为具有多种作用机制的药物通过促进细菌细胞成分与非经典氨基酸侧链中存在的特定官能团之间的相互作用,或在与膜接触时显着改变结构。

研究内容二:化学和生物防治平台

一旦我们了解了构成强效AMP的氨基酸序列,我们就可以使用化学和生物系统来生产这些分子。数据库中描述的大多数肽是天然存在的分子,它们通常分为两类:由核糖体产生的基因编码肽和由多种酶催化反应产生的非基因编码肽。基因编码的肽更常见,因为它们是在宿主免疫系统内产生的。这种天然肽及其合成衍生物可以使用多种方法进行化学或生物合成,包括 SPPS、无细胞系统,和细菌中的重组生产和真菌。

重组表达(图1C),在治疗性蛋白质生产中起核心作用(例如,胰岛素生产的扩大),代表了 AMP 的一种有前途的方法。编码目的肽的DNA序列可以被引入宿主或无细胞提取物中,之后天然转录和翻译机制产生肽。重组表达几乎可以从其相应的DNA序列中产生任何给定的肽或蛋白质,而没有任何大小限制,现在可以通过改进的重组方法扩大生产规模。目前,蛋白药物的典型制造成本约为每克 10,000 L 10-50 美元。

此外,基因组测序和转录组学可用于设计和生成大型肽文库。重组技术还提供可扩展且具有成本效益的 AMP 生产,产生比化学合成路线更高的产量,因为工程微生物(如细菌和酵母)或者它们的无细胞提取物可以被基因操纵。为了防止肽降解和对宿主的毒性,AMP可以表达为融合蛋白由载体和纯化标签蛋白组成,然后是所需的AMP序列的切割位点。

多孔板检测是筛选化学合成文库活性的最常用方法,其设计和读数简单灵活。但是,这种方法仅适用于筛选小型库;对于由 >10 组成的图书馆来说,这个过程非常费力和耗时3成员。为了产生更大尺寸和更高多样性的文库,可以通过计算机设计或定点饱和诱变制备DNA编码的肽文库,随后用于转化特定宿主(细菌或酵母)以产生最终的肽文库。Guralp 等人在计算机中克隆了 12K AMP 编码寡核苷酸文库,将其设计到周质渗漏的大肠杆菌菌株中,以有效分泌 AMP。稀释产生肽的大肠杆菌文库并用无害李斯特菌 ATCC 33090 接种,菌落产生大的抑制区,这些抑制区被选择和测序。作者分离出两个由37个氨基酸组成的车底素-423突变体,其MICs比野生型AMP针对测试菌株的MIC2倍。

AMP表达相关的主要挑战是它们对宿主细菌的致死性。融合蛋白可以掩盖肽,从而降低对其宿主的毒性。已经制定了其他战略来克服这个问题。最近,Ishida 等人发现,一种无处不在的真核钙传感器蛋白钙调蛋白(CaM)具有带负电荷的表面,可以用作产生多种类型 AMP 的通用载体蛋白。CaM具有两个柔性和独立的球状结构域的结构,允许与AMP结合并掩盖其毒性。另一种将对宿主毒性降至最低的方法是通过形成包涵体在大肠杆菌中产生肽,包涵体将 AMP 埋在不溶性聚集体中。包涵体可实现高水平的蛋白表达和简单的纯化过程。在特定条件下形成包涵体的几种载体蛋白,如PurF片段,PaP3.30,和OnconaseC末端已被识别。

用于生产肽的细菌细胞的一种有前途的替代品是使用酵母,因为这些生物具有对AMP介导的杀伤具有抗性的优势,并具有真核生物的转录后和翻译后修饰系统。此外,毕赤酵母等酵母菌可以有效地将肽分泌到周围的培养基中,以增加滴度并降低纯化成本并且可以使用甲醇诱导蛋白AOX1等系统进行严格调节。我们最近开发了一种基于重组酶的基因整合平台,用于毕赤酵母细胞中可靠、快速的菌株工程和生物制剂生产。毕赤酵母已被用于生产 AMP,例如防御素、plectasin衍生肽,和 cecropin无需载体蛋白。

最近,Chen等人通过采用N-甲基-N-硝基-N-亚硝基胍(NTG)诱变来产生一种减少质粒整合到基因组中的菌株,从而显着增强了毕赤酵母中芹素的表达比野生型菌株。GAP是毕赤酵母中常用的组成型启动剂,因此无需使用甲醇;然而,当表达的蛋白质有毒时,其组成型表达限制了其应用。因此,该启动子仅用于表达少数 AMP,包括 defensin、天芥素D,和 MP1102。然而,与大肠杆菌类似,内源性酵母蛋白酶可以降解 AMP,并且这些分子的净正电荷可能会阻碍它们从细胞中分泌,因为与膜表面带负电荷的分子发生静电相互作用。为了提高蛋白质分泌和总产量,我们的实验室最近在P. pastoris中开发了一种基于人血清白蛋白(HSA)融合蛋白的AMP生产系统。HSA 可以促进 P. pastoris 中的蛋白质表达和分泌,并且已经产生了许多 HSA 融合蛋白,滴度很高。为了纯化和释放 AMP,我们还在载体、HSA AMP 序列之间插入了多聚组氨酸标签(His-tag)和 TEV 蛋白酶切割位点。上清液中HSA-AMP融合蛋白的滴度大于700 mg L1,远高于使用大力杆菌获得的产量。
研究内容三:计算机引导设计

迄今为止,几乎所有的肽工程都涉及对天然分子的修饰。然而,通过提出自然序列中的突变,计算机引导的肽设计允许探索序列空间的更大区域,这些区域以前没有在实验室或整个进化过程中进行过分析。计算机引导设计还有一个额外的优势,即它消除了合成和筛选生成的每个变体的需要,从而节省了时间、劳动力和费用(图2A)。计算机引导的方法基于物理化学原理,这些原理是结构趋势和生物活性的基础。目前,用于预测AMP功能的计算机引导方法的主要局限性之一是需要标准化和可靠的生物学数据作为高效设计过程的输入。计算方法已经发展到可以训练计算机来开发和增强分析以优化传统的非计算设计方法,例如不同类型的SAR策略。这些技术可以与各种结构相结合,其设计基于自然序列。肽可以准确地生成,也可以通过进化模板来生成生物活性肽来改进,我们将在下面讨论。

抗菌肽的发现工具。(A AMP可以通过组合合成、计算机合成或从自然界中提取而产生;然而,这些过程既费时又费钱。为了优化AMP的发现,已经开发了基于不同方法的计算框架。(B)遗传算法通常用于评估和演化模板中的序列。另一种选择是使用(C)模式识别算法来识别负责冗余序列中肽生物活性的最小部分,或(D)定量结构-活性关系研究来识别活性决定因素,这些决定因素可能被分离出来以生成具有优化特征的较短肽以显示靶向活性。

当分子的潜在活性谱未知时,基于配体的模型对于AMP预测是有效的。使用数据挖掘,Mardirossian 等人。鉴定出Tur1ATur1B,这是来自宽吻海豚的两种富含脯氨酸的AMP。特异性转运蛋白使这些富含脯氨酸的 AMP 能够被易感细菌内化,一旦内化,这些试剂就会干扰蛋白质合成和折叠,导致细胞死亡。作者表明,Tur1A 通过内膜转运蛋白 SbmA YjiL/MdM 被大肠杆菌内化而不会引起膜损伤,并且它通过与核糖体结合并阻断从起始期到延伸期的过渡来抑制细菌蛋白质合成。另一方面,Tur1B适度抑制蛋白质合成,并且似乎通过不同的、尚不清楚的作用机制发挥其抗菌活性。

越来越多的大型数据库能够生成用于 AMP 预测的机器学习(ML/人工智能(AI)算法。例如,Yoshida等人。提出了一项概念验证研究,描述了通过序列空间探索发现AMP的有效策略。作者使用闭环方法结合了遗传算法、ML和体外评估来提高肽的抗菌活性。这些努力导致从小型天然阳离子模板 Temporin-Ali FFPIVGKLLSGLL-NH)中发现了 44 种先导肽。仅经过三个周期的迭代后,获得的命中率比野生型天然 AMP 高出 160 倍。这项工作还增加了生成的肽中存在的螺旋构象程度,并证明与模板和第一代创建的肽相比,它们的螺旋含量更高。螺旋度较高的AMP比野生型更活跃,证实了作者的结构预测。作者获得的结果是ML如何加速发现具有良好抗菌活性的肽的一个例子,同时允许探索许多结构模式并揭示描述符对肽生物活性的影响。

基于支持向量机(SVM)的分类器也可用于通过其作用机制预测 AMPLee等人。开发了一种分类器,用于研究通过破坏膜稳定性起作用的螺旋 AMP。该方法在分析相似肽时将螺旋结构视为最重要的活性描述符。作者观察到,AMP增加了负高斯膜曲率,这是经历裂变过程的磷脂膜的特征。这种作用与抗菌活性间接相关;因此,该研究为螺旋肽对细菌膜的活性提供了关键的拓扑学见解。

基于统计的计算方法代表了传统计算机引导肽设计的替代策略。这些方法使用生物信息学工具,如统计建模、SAR 研究、神经网络和 ML,来分析和增强数据库中描述的 AMP 的活性。Porto 等人最近发表了对 AMP 数据库和数据挖掘的广泛概述。使用计算方法与结构和物理化学特征相结合,可以准确预测抗菌分子。

分子建模(MM)和分子动力学(MD)是分析结构与 AMP(图 3D)对生物膜或模拟它们的人造膜的活性关系的有效方法。MD可用于提出AMP的作用机制或提取影响抗菌活性的生物学描述符(图3A)。然而,时间尺度和通过经验分析进行验证的需要仍然是该技术的限制因素。最重要的生物过程,包括AMP内化或在不稳定之前与膜的相互作用,都是毫秒级的。然而,目前的 MD 模拟以纳秒到微秒的速度运行。因此,在能够对复杂的生物过程进行精确建模方面,仍然存在几个数量级的差距。收集馈送或验证 MD 模拟所需的实验数据并非易事且成本高昂。只有少数几个小组能够进行小规模的实验,从而验证MD模拟预测。


图3 用于多肽设计的高通量框架。(A) 结构引导探索AMP活性的结构和物理化学描述符的功能热点。(B)算法和统计模型与现有的生物活性肽模板相结合。


研究内容四:自学计算方法


神经网络的使用,特别是深度学习,因为计算机引导的方法正在加速AMP的发展(图3B)。通过自学习直接预测AMP活性和构建序列的潜力是该方法相对于其他方法的明显优势。例如,GA 旨在根据输入序列演化序列,这些序列用作初始数据集,其结果不用于改进算法。通常,神经网络的不同层被分层到决策树中,因此其中一个层的输出数据会导致一组更深层次的相关层,这些层测量前一个层的直接影响,特别是来自与内在属性和活动相关的描述符。初始描述符是一维静态值,因此用作计算或组成其他描述符的基础。

已经提出了监督ML方法来开发抗菌活性预测模型。使用了两种不同的预测策略:序列大小变异和序列顺序。一旦选择了序列顺序,就无法修改大小,并且根据每个位置的氨基酸残基频率进行预测。否则,如果序列大小变化是一个选项,则序列将转换为描述符。

尽管这些方法很有前途,特别是在其准确性方面,但我们仍然缺乏执行直接数据库搜索的能力,除了为识别隐藏在较大蛋白质中的加密AMP而开发的方法。AMP异质性是肽设计领域的额外挑战,GAML和深度学习等预测方法已被应用于补充其他序列搜索方法。另一个可用于更好地理解和设计 AMP 的重要工具是 MM,通常与 MD 相关联。MM能够识别具有非常有限身份的同源序列,只要存在高度的结构守恒。建模可以通过两种技术识别相似的序列:线程和从头开始建模。线程方法使用模板从查询序列预测三维结构,而从头开始建模,也称为从头建模或自由建模,使用设计的能量函数和指导构象搜索的广义构象概率来预测没有先前结构信息的蛋白质结构。这些方法已成功应用于选择半胱氨酸保守肽,包括防御素、环苷酸和苜蓿素并阐明抗利什曼原虫肽。与肽MM相关的另一个挑战是将具有不同生物活性的类似结构的结构和功能相关联。在这种情况下,识别出与已知 AMP 结构具有高度同一性的序列并不一定证明该序列是规范的 AMP

替代深度学习技术也可用于生成 AMPMüller等人提出了一种能够通过组合设计(例如,具有不同氨基酸残基的单突变筛选)生成从头肽的递归神经网络。该模型捕获了α螺旋AMP序列中的模式,从而从学习的上下文中生成肽。该方法预测了 82% 的活性 AMP,而随机采样序列的预测结果为 65%,其氨基酸分布与训练集相同。这些策略为肽生成提供了替代方案,可能消除了对序列文库进行详尽的高通量筛选的需要。




小编有话说:


自从肽首次被描述为抗菌剂以来,人们已经尝试增强其活性,以将它们转化为现有抗生素的有效替代品。我们认为,将AMPs成功转化为疗法将涉及以下步骤:(1)了解在肽的抗菌活性中起重要作用的分子描述符;2)准确预测其体外活性;3)计算机模拟数字化,将设计、合成和分析的整个工作流程计算机化,以有效利用其序列空间并准确预测其抗菌活性。

近年来,已经克服了以前阻止这些分子转化为药物的几个障碍。例如,约束和吻合肽的方法的进步提高了稳定性,并设计了具有较短序列的肽,这些肽可以选择性地靶向病原体,并且可以使用合成生物学和高通量技术轻松表达或合成。特别是,在计算机科学和合成生物学概念的支持下,用于设计、发现、生产和快速生物功能评估的工具和技术可能会改变这一领域。这些框架已经用于生成复杂的数据集(来自预测、计算和功能筛选),需要对其进行充分分析。

传统上,我们无法对AMP进行编程,因为我们没有从第一性原理完全理解这些分子。AMP设计是使用从非标准化实验中获得的平均或近似的物理化学和结构描述符值完成的。由于缺乏测量肽特性(包括抗菌活性)的标准化检测方法,导致数据库的生成虽然非常有帮助,但对于使用当今的计算能力从结构中预测肽功能的准确性不够准确。

在这篇综述中,我们描述了最近的进展,我们认为这些进展可能使按需编程AMP分子成为可能。经验和计算方法和工具的标准化在生物学中仍处于起步阶段。结合计算机科学、建模和合成生物学的原理,可以更系统地探索肽的作用方式和活性,从而产生一代抗生素。



撰稿:帅文静

校稿:曹少攀












关注我们了解

更多

微信号:

BioChemWorld








生化江湖
格物致知的学习之道
 最新文章