Synthetic Biology and Computer-Based Frameworks for Antimicrobial Peptide Discovery
研究背景
抗生素耐药性是我们社会中最大的医疗问题之一,目前,欧洲每年有超过25,000人死亡,美国每年有35,000人死亡。几十年来,抗微生物药物耐药微生物的数量一直在增长。这些病原体引起的感染缺乏有效的治疗方案,对经济产生了深远的影响以及我们的福祉。据估计,全球范围内这个问题的严重程度令人震惊,特别是在过去几十年中,抗生素一直没有被发现。因此,我们必须开发能够对抗多重耐药微生物的抗菌剂并减缓抗生素耐药性的演变和传播。
抗菌肽(AMP)基本上是由地球上所有生物体自然产生的并通过多种作用机制作为防御系统,抵御入侵的病原体。这些分子作为免疫系统的一部分已经进化了数十亿年并提供针对一系列病原微生物(包括细菌、真菌、病毒和寄生虫)的广谱保护。AMP 体积小(长度在 6 到 50 个氨基酸残基之间),并且具有两亲性和阳离子结构,由于存在 Lys 和 Arg 残基,通常具有 +2 和 +9 之间的净正电荷。它们大约 50% 的一级结构由疏水性和脂肪族残基组成,这些残基能够与膜相互作用并易位到细胞中。由于其强大的抗菌活性、尺寸和物理化学特性,AMP 代表了用于工程的多功能支架,并已被广泛研究。然而,一些障碍,如毒性、有限的生物利用度、对病原体的特异性不足以及大规模生产的困难,阻碍了AMP作为治疗传染病的治疗剂的发展。然而,设计策略、合成方法和递送系统的最新进展正在改变将合成 AMP 转化为用于治疗耐药性感染的下一代标准护理抗生素的可能性。
研究摘要
研究内容
传统的 AMP 设计方法依赖于不可推广的实验试错法。这些非计算方法能够产生高活性的 AMP,尽管缺乏标准化设计和实验方法的局限性,在大型数据集和适当的计算能力出现之前,这些条件占主导地位。下面,我们概述了迄今为止使用的最重要的策略。
通过添加、删除或替换氨基酸残基来突变天然肽有助于评估每个残基对任何给定肽模板的影响。通过比较肽功能如何受到疏水性、两亲性、净电荷和拓扑表面相关特性等特性的绝对值或平均值差异的影响,可以评估与肽活性相关的特征。其中一些生物学描述符很容易通过经验或简单的序列分析提取。然而,更复杂的描述符,例如从分子动力学和量子计算(例如,拓扑和能量参数)得出的描述符在过去的几十年里,已经使用生物信息学和计算工具进行了描述。
系统的单残基取代可以覆盖序列空间的很大一部分,是识别和表征物理化学和结构特性对生物活性影响的最直接的实验方法。进行系统氨基酸取代研究的两种主要方法是单突变肽文库,包括将所需的氨基酸残基(例如,Ala)引入肽序列中的每个位置,以阐明每个残基的功能,以及高通量筛选,其中合成和分析大量变体。使用扫描组合文库时,生成的变体数量取决于给定肽中存在的氨基酸的初始数量。例如,一个 12 聚体肽将呈现 2012≅4.1 × 1015变化,这只是考虑到 20 种天然存在的经典氨基酸。然而,由于这种变化数量对于实验分析是不可行的,因此可以在序列中固定特定的残基,例如Ala,以生成组合文库。这些扫描用于旨在描述决定性热点及其对生物活性的影响的研究。作为扫描组合库有效性的一个例子,Torres 等人。报道了一种全面的物理化学指导方法,用于将有毒的α螺旋黄蜂毒液肽重编程为无毒抗生素。本研究系统地分析了每种氨基酸残基对结构和理化性质的贡献,从而实现了后续的结构引导设计,与模板毒素相比,产生了具有最小或没有细胞毒性和溶血活性的优化合成肽,并增加了抗菌功能。优化的AMP在体外和体内均对细菌和真菌具有活性。与野生型分子相比,对原始序列的修改导致更高的螺旋含量,导致抗菌活性增加。将平均疏水性值保持在特定热点范围内,同时尊重螺旋结构的两亲性平衡,导致细胞毒性的抑制。此外,插入模板肽的亲水面的正电荷降低了细胞毒性和溶血活性。
图1 AMP制造方法。(A) AMP可以使用固相策略通过传统的化学合成来制造,但这些方法既费时又昂贵。(B)已经开发了高通量方法,以加快该过程并使其更便宜、更环保,从而可以探索AMP化学空间。(C)后期临床试验和商业生产需要大规模生产,合成生物学技术推动了这些过程,这些技术允许生物体表达肽。
固相肽合成(SPPS)允许将不寻常的氨基酸高产率和纯度掺入肽序列中。在改善AMP的策略中,用d-氨基酸对应物部分或完全取代l-氨基酸是一种方法这一直被证明可以改善关键功能参数,如肽活性,毒性和抗降解性在肽酶存在下。含有 d-氨基酸的 AMP 也被证明是有效的抗生物膜,抗癌抗寄生虫,抗真菌的和免疫调节肽。
研究内容二:化学和生物防治平台
重组表达(图1C),在治疗性蛋白质生产中起核心作用(例如,胰岛素生产的扩大),代表了 AMP 的一种有前途的方法。编码目的肽的DNA序列可以被引入宿主或无细胞提取物中,之后天然转录和翻译机制产生肽。重组表达几乎可以从其相应的DNA序列中产生任何给定的肽或蛋白质,而没有任何大小限制,现在可以通过改进的重组方法扩大生产规模。目前,蛋白药物的典型制造成本约为每克 10,000 L 秤 10-50 美元。
此外,基因组测序和转录组学可用于设计和生成大型肽文库。重组技术还提供可扩展且具有成本效益的 AMP 生产,产生比化学合成路线更高的产量,因为工程微生物(如细菌和酵母)或者它们的无细胞提取物可以被基因操纵。为了防止肽降解和对宿主的毒性,AMP可以表达为融合蛋白由载体和纯化标签蛋白组成,然后是所需的AMP序列的切割位点。
多孔板检测是筛选化学合成文库活性的最常用方法,其设计和读数简单灵活。但是,这种方法仅适用于筛选小型库;对于由 >10 组成的图书馆来说,这个过程非常费力和耗时3成员。为了产生更大尺寸和更高多样性的文库,可以通过计算机设计或定点饱和诱变制备DNA编码的肽文库,随后用于转化特定宿主(细菌或酵母)以产生最终的肽文库。Guralp 等人在计算机中克隆了 12K 的 AMP 编码寡核苷酸文库,将其设计到周质渗漏的大肠杆菌菌株中,以有效分泌 AMP。稀释产生肽的大肠杆菌文库并用无害李斯特菌 ATCC 33090 接种,菌落产生大的抑制区,这些抑制区被选择和测序。作者分离出两个由37个氨基酸组成的车底素-423突变体,其MICs比野生型AMP针对测试菌株的MIC低2倍。
与AMP表达相关的主要挑战是它们对宿主细菌的致死性。融合蛋白可以掩盖肽,从而降低对其宿主的毒性。已经制定了其他战略来克服这个问题。最近,Ishida 等人发现,一种无处不在的真核钙传感器蛋白钙调蛋白(CaM)具有带负电荷的表面,可以用作产生多种类型 AMP 的通用载体蛋白。CaM具有两个柔性和独立的球状结构域的结构,允许与AMP结合并掩盖其毒性。另一种将对宿主毒性降至最低的方法是通过形成包涵体在大肠杆菌中产生肽,包涵体将 AMP 埋在不溶性聚集体中。包涵体可实现高水平的蛋白表达和简单的纯化过程。在特定条件下形成包涵体的几种载体蛋白,如PurF片段,PaP3.30,和Onconase的C末端已被识别。
用于生产肽的细菌细胞的一种有前途的替代品是使用酵母,因为这些生物具有对AMP介导的杀伤具有抗性的优势,并具有真核生物的转录后和翻译后修饰系统。此外,毕赤酵母等酵母菌可以有效地将肽分泌到周围的培养基中,以增加滴度并降低纯化成本并且可以使用甲醇诱导蛋白AOX1等系统进行严格调节。我们最近开发了一种基于重组酶的基因整合平台,用于毕赤酵母细胞中可靠、快速的菌株工程和生物制剂生产。毕赤酵母已被用于生产 AMP,例如防御素、plectasin衍生肽,和 cecropin无需载体蛋白。
迄今为止,几乎所有的肽工程都涉及对天然分子的修饰。然而,通过提出自然序列中的突变,计算机引导的肽设计允许探索序列空间的更大区域,这些区域以前没有在实验室或整个进化过程中进行过分析。计算机引导设计还有一个额外的优势,即它消除了合成和筛选生成的每个变体的需要,从而节省了时间、劳动力和费用(图2A)。计算机引导的方法基于物理化学原理,这些原理是结构趋势和生物活性的基础。目前,用于预测AMP功能的计算机引导方法的主要局限性之一是需要标准化和可靠的生物学数据作为高效设计过程的输入。计算方法已经发展到可以训练计算机来开发和增强分析以优化传统的非计算设计方法,例如不同类型的SAR策略。这些技术可以与各种结构相结合,其设计基于自然序列。肽可以准确地生成,也可以通过进化模板来生成生物活性肽来改进,我们将在下面讨论。
图2 抗菌肽的发现工具。(A) AMP可以通过组合合成、计算机合成或从自然界中提取而产生;然而,这些过程既费时又费钱。为了优化AMP的发现,已经开发了基于不同方法的计算框架。(B)遗传算法通常用于评估和演化模板中的序列。另一种选择是使用(C)模式识别算法来识别负责冗余序列中肽生物活性的最小部分,或(D)定量结构-活性关系研究来识别活性决定因素,这些决定因素可能被分离出来以生成具有优化特征的较短肽以显示靶向活性。
当分子的潜在活性谱未知时,基于配体的模型对于AMP预测是有效的。使用数据挖掘,Mardirossian 等人。鉴定出Tur1A和Tur1B,这是来自宽吻海豚的两种富含脯氨酸的AMP。特异性转运蛋白使这些富含脯氨酸的 AMP 能够被易感细菌内化,一旦内化,这些试剂就会干扰蛋白质合成和折叠,导致细胞死亡。作者表明,Tur1A 通过内膜转运蛋白 SbmA 和 YjiL/MdM 被大肠杆菌内化而不会引起膜损伤,并且它通过与核糖体结合并阻断从起始期到延伸期的过渡来抑制细菌蛋白质合成。另一方面,Tur1B适度抑制蛋白质合成,并且似乎通过不同的、尚不清楚的作用机制发挥其抗菌活性。
越来越多的大型数据库能够生成用于 AMP 预测的机器学习(ML)/人工智能(AI)算法。例如,Yoshida等人。提出了一项概念验证研究,描述了通过序列空间探索发现AMP的有效策略。作者使用闭环方法结合了遗传算法、ML和体外评估来提高肽的抗菌活性。这些努力导致从小型天然阳离子模板 Temporin-Ali (FFPIVGKLLSGLL-NH)中发现了 44 种先导肽。仅经过三个周期的迭代后,获得的命中率比野生型天然 AMP 高出 160 倍。这项工作还增加了生成的肽中存在的螺旋构象程度,并证明与模板和第一代创建的肽相比,它们的螺旋含量更高。螺旋度较高的AMP比野生型更活跃,证实了作者的结构预测。作者获得的结果是ML如何加速发现具有良好抗菌活性的肽的一个例子,同时允许探索许多结构模式并揭示描述符对肽生物活性的影响。
基于支持向量机(SVM)的分类器也可用于通过其作用机制预测 AMP。Lee等人。开发了一种分类器,用于研究通过破坏膜稳定性起作用的螺旋 AMP。该方法在分析相似肽时将螺旋结构视为最重要的活性描述符。作者观察到,AMP增加了负高斯膜曲率,这是经历裂变过程的磷脂膜的特征。这种作用与抗菌活性间接相关;因此,该研究为螺旋肽对细菌膜的活性提供了关键的拓扑学见解。
基于统计的计算方法代表了传统计算机引导肽设计的替代策略。这些方法使用生物信息学工具,如统计建模、SAR 研究、神经网络和 ML,来分析和增强数据库中描述的 AMP 的活性。Porto 等人最近发表了对 AMP 数据库和数据挖掘的广泛概述。使用计算方法与结构和物理化学特征相结合,可以准确预测抗菌分子。
图3 用于多肽设计的高通量框架。(A) 结构引导探索AMP活性的结构和物理化学描述符的功能热点。(B)算法和统计模型与现有的生物活性肽模板相结合。
神经网络的使用,特别是深度学习,因为计算机引导的方法正在加速AMP的发展(图3B)。通过自学习直接预测AMP活性和构建序列的潜力是该方法相对于其他方法的明显优势。例如,GA 旨在根据输入序列演化序列,这些序列用作初始数据集,其结果不用于改进算法。通常,神经网络的不同层被分层到决策树中,因此其中一个层的输出数据会导致一组更深层次的相关层,这些层测量前一个层的直接影响,特别是来自与内在属性和活动相关的描述符。初始描述符是一维静态值,因此用作计算或组成其他描述符的基础。
已经提出了监督ML方法来开发抗菌活性预测模型。使用了两种不同的预测策略:序列大小变异和序列顺序。一旦选择了序列顺序,就无法修改大小,并且根据每个位置的氨基酸残基频率进行预测。否则,如果序列大小变化是一个选项,则序列将转换为描述符。
尽管这些方法很有前途,特别是在其准确性方面,但我们仍然缺乏执行直接数据库搜索的能力,除了为识别隐藏在较大蛋白质中的加密AMP而开发的方法。AMP异质性是肽设计领域的额外挑战,GA、ML和深度学习等预测方法已被应用于补充其他序列搜索方法。另一个可用于更好地理解和设计 AMP 的重要工具是 MM,通常与 MD 相关联。MM能够识别具有非常有限身份的同源序列,只要存在高度的结构守恒。建模可以通过两种技术识别相似的序列:线程和从头开始建模。线程方法使用模板从查询序列预测三维结构,而从头开始建模,也称为从头建模或自由建模,使用设计的能量函数和指导构象搜索的广义构象概率来预测没有先前结构信息的蛋白质结构。这些方法已成功应用于选择半胱氨酸保守肽,包括防御素、环苷酸和苜蓿素并阐明抗利什曼原虫肽。与肽MM相关的另一个挑战是将具有不同生物活性的类似结构的结构和功能相关联。在这种情况下,识别出与已知 AMP 结构具有高度同一性的序列并不一定证明该序列是规范的 AMP。
撰稿:帅文静
校稿:曹少攀
关注我们了解
更多
微信号:
BioChemWorld