引言 /Introduction
化学合成作为一种控制物质结构和性质的工具,是化学学科的核心。从精细化学品、聚合物的合成,到药物和固态材料的开发,化学合成发挥着关键作用。然而随着该领域的不断发展,当需要处理更大、更复杂的分子和分子复合体时,传统的合成化学工具逐渐显得力不从心。相比之下,大自然创造了完全不同的策略来创造组成活细胞的生物大分子和分子系统。
化学合成与生物合成领域的著名学者 Peter G. Schultz 一直有这样的思考:我们是否能够利用大自然的合成策略和机制,结合现代化学工具,创造出新的大分子甚至是自然界中不存在的生物体呢?这个想法推动他在化学与生物交叉领域了进行了超过 40 年的探索,并做出了大量突破性的贡献。
2024 年 8 月 28 日,Peter G. Schultz 在 ACS ACCOUNTS 上发表自述文章 ⌈Synthesis at the Interface of Chemistry and Biology⌋,概述了其实验室及其合作伙伴的过往重要工作以及发展历程。
对于希望在化学与生物学交叉领域中推进研究的学者而言,Schultz 的心路历程与研究成果总结无疑是宝贵的参考。因此再创对该文章进行了全文整理,部分细节内容存在少许删减。
Peter G. Schultz / 作者
范锐 / 整理
孟凡康 / 审校
本文章的核心概述(Peter G. Schultz 第一人称自述):
通过对核糖体蛋白合成的复杂多组分机制进行重编程,向遗传密码中添加新的元件,我们突破了蛋白质化学性质的十亿年限制。我们利用了“生物正交性”概念,在细胞中引入了独特的密码子、tRNA 和氨酰-tRNA 合成酶,从而将自然界不存在的氨基酸编码进了蛋白质中。这一技术让我们能够像化学家对小分子进行精确调整一样,对蛋白质的结构进行了精准改变——这超越了仅依靠生物学方法所能实现的范围。我们开始能够前所未有地在体外和体内探究蛋白质的结构和功能,甚至制造出具有增强药理作用的治疗性蛋白质。
最后一个例子是利用大型化学库、机器人和高通量细胞表型筛选来识别出可以用来探测和操控复杂细胞生物学的小型合成分子。(比如,一些类药物分子可以控制细胞的发展趋势。)这种方法提供了对复杂生物学的新见解,补充了基因组学方法,并可以开发出通过新作用机制发挥作用的新药物,例如选择性再生组织的药物。
通过将我们在分子结构和反应性方面的知识与我们对活细胞复杂机制的理解和能力相结合,从而开辟合成的新领域,这使得诸多可能成为现实。本报告概述了从早期到现在,我的实验室以及与我们的合作者一起围绕这些中心主题开展的工作。
// 作者介绍
Peter G. Schultz
美国国家科学院院士、斯克里普斯研究所(Scripps)所长。Peter G. Shultz 是国际化学生物学领域的先驱,是催化抗体、遗传密码子拓展和高通量筛选等化学与生命科学交叉领域的开拓者之一。他的主要研究方向包括组合化学、催化抗体、分子定向进化、利用基因密码子扩展技术创造具有新化学和生物特性的生物大分子以及利用细胞筛选具有新生物活性的小分子。Peter G. Shultz 亦诸多中美著名学者的研究导师。
大一时,我在加州理工学院受 Dave Evans 教授的高级化学课程启发,开始了我的化学研究之路。在离开加州理工学院一年后,我进入铸造厂成为了一名夜班工人,终日倒铸熔融铝液并制作砂模(这段经历让我意识到,能够从事科学研究是多么的幸运啊)。
随后我回到了加州理工学院,不久便在 Dervan 实验室开始了研究生生涯,研究 1,1-二氮烯(1,1-diazene)这种反应性中间体的热化学和光化学反应。当时,我的计划是专攻物理有机化学领域,并且已经设想了一种创新的方式:通过与简单卤化物共沉积的钠原子进行低能量光解电子转移,在 4K(开尔文)条件下直接观察一系列高度活性的分子(如应变炔、双自由基等)。
我之所以提到这个,是因为在我们第二年的候选考试要求写三份研究计划。这个关键的的学业要求促使我提前开始思考未来独立科研时可能从事的科学研究方向。然而在研究生三年级时,我偶然间对生命科学产生了兴趣。当时我决定开始一个全新的项目,专注于生成切割特定 DNA 序列的分子。在自学了一些生物化学内容并走了一些弯路后,我终于成功合成并表征了一系列聚吡咯酰胺,这些分子表现出令人印象深刻的 DNA 结合选择性。
随后,我作为博士后加入了 Christopher T. Walsh 教授的实验室,期间自学了基础的分子生物学和蛋白质化学。在此期间,我不但在 MIT 担任博士后研究员,同时在伯克利建立了自己的实验室,带领四位充满冒险精神的研究生,它们分别是:Spencer Anthony-Cahill、Chris Noren、Ron Zuckermann 和 Jeff Jacobs。我们实验室的核心研究方向当时是(至今也是)合成具有新颖生物和化学性质的分子及分子系统。
我们的方法之所以与众不同(甚至与化学系的传统研究格格不入),是因为我们提出了这样一个问题:是否可以利用细胞复杂的合成机制,结合传统化学工具,来获得那些通过传统化学方法难以制造的大分子?为了解决这个问题,我们最初的研究方案重点是利用免疫系统的多样性以及核糖体蛋白质合成的高效生物合成机制。
// 催化性抗体与分子多样性
我们从自然界中获得的一个早期灵感是其如何运用“合成策略(synthetic strategy)”来解决抗体识别外来病原体的分子识别问题。与化学家传统上逐个理性设计并依次优化受体的做法不同,免疫系统通过 V、D 和 J 基因的遗传重组(结合连接点和插入多样性)生成一个包含数十亿种初始抗体(germline antibodies)的庞大库。最初这些抗体只具备适度的亲和力,随后通过体细胞突变和克隆选择,进一步优化其亲和力和选择性。关键是,这个过程仅需几周时间就能产生具有高亲和力和高选择性的受体,这与当时主流的逐步优化分子主体和人工酶设计与合成策略形成了鲜明对比。
我们的疑问是(Richard A. Lerner 实验室也提出过类似问题):是否能够借助这一自然的多样性机制,来设计出具有选择性的催化剂?
Richard A. Lerner(1938-2021)
美国著名的免疫学家和化学家、曾担任 Scripps Research Institute 主席,并在该机构推动了跨学科研究的发展。同时 Lerner 在学术界享有极高的声誉,获得了诸多个奖项与荣誉,包括沃尔夫化学奖(Wolf Prize in Chemistry)。他的工作对现代生物技术和医药开发产生了深远的影响。其中 Lerner 是噬菌体展示技术(phage display)的早期推动者之一(该技术于 2018 年获得诺贝尔化学奖)。Richard A. Lerner 的研究方向主要集中在免疫学和化学生物学领域,尤其是在抗体工程和酶催化方面。
于是我们采用了一种基于 Linus Carl Pauling 关于酶催化理论的策略,酶并不是对反应物的初始状态(即“基态”)有最高的亲和力,而是对反应过程中形成的“过渡态”具有最大的亲和力。也就是说,酶是通过稳定反应物在过渡态时的结构来加速反应的。如果这一理论成立,那么诱导生成针对高能过渡态类似物的抗体就应当能产生选择性催化剂——正如费曼所言,“proof by synthesis”(通过合成来验证)。
为了验证这一理论,我们开展了早期的催化性抗体实验,并取得了积极的结果。Jeff Jacobs 和 Scott Pollack 的实验采用了简单的膦酸酯或磷酸酯水解反应的过渡态类似物作为抗原,成功诱导产生了具有催化性的抗体。为了回应那些反复提出“这不是化学”批评的人,我们进一步学会了通过制造单克隆抗体,分离出具有明确结构的抗体,并对其进行详细的生化和结构表征。
早期一个十分鼓舞人心的结果是,科研人员使用膦酸酯双酯(phosphonate diester)诱导出了一种抗体,该抗体可催化一个酯交换反应,其表观二级反应速率常数为 5.4 × 10⁴ M⁻¹ min⁻¹,远远快于未催化反应的速率(2.6 × 10⁻⁴ M⁻¹ min⁻¹)(图 1)。随后,我们进一步探索了抗体催化的应用范围,并研究了从免疫系统中诱导抗体催化剂的不同策略。这项工作最初由 John Jacobsen、Kevan Shokat、Linda-Hsieh Wilson 和 Andrea Cochran 领导开展。除了对过渡态类似物的探索,我们还从自然界的催化机制中获得了灵感,特别是 Haldane 的“底物应变(substrate strain)”理论。该理论被用于诱导一种催化性抗体铁螯合酶,这种酶催化血红素生物合成的最后一步——卟啉环的金属化反应。研究使用了 N-甲基卟啉作为半抗原,模拟铁螯合酶结合的卟啉底物的“开放”扭曲构象,成功分离出一种催化抗体,该抗体在催化与 Zn²⁺反应时的速率仅比天然酶慢 10 倍(图 1)。光谱和 X 射线结构分析表明,这种抗体能够以高能扭曲的构象结合底物,这再次通过合成实验证实了 Haldane 的底物应变理论。
另一种催化剂的优化策略是设计半抗原,利用半抗原诱导在抗体结合位点生成催化基团(例如,一般的碱或酸),并精确定位以加速目标反应。比如,设计了一种含铵离子的半抗原,诱导抗体结合位点产生天冬氨酸残基,该残基作为一般碱催化消除反应。这一策略的最佳经典例子来自 Lerner 和 Barbas 的研究,他们设计了一个带有β-二酮基团的半抗原,诱导结合位点生成赖氨酸(通过形成共价抗体-半抗原亚胺),使赖氨酸恰好位于合适位置,催化醛醇反应,形成 Schiff 碱中间体。这项研究很可能启发了 Barbas 后续对有机催化领域的进一步探索。抗体催化的应用还涵盖了一系列反应,包括 Claisen、Oxy-Cope 和 Diels−Alder 等周环反应,反 Baldwin 环化反应,酰胺水解,以及氧化还原反应和阳离子重排反应。
▲ 图 1:抗体催化的(A)酯交换反应和(B)金属化反应以及相应的半抗原。
此外,我们与 Ray Stevens 的合作,首次详细表征了抗体从生殖系到亲和力成熟抗体的演化结构。这一研究为理解免疫系统如何生成几乎对任何分子都具有高亲和力的受体提供了基础性见解。如前所述,抗体库的多样性主要源于初级免疫反应中 V、D、J 基因片段的组合连接、由于 V−(D)−J 连接的非精确性导致的连接区多样性,以及后续亲和力成熟过程中抗体基因的体细胞突变。
为了更深入了解抗体催化中的结合潜力,我们研究了抗体的免疫演化机制。我们对四种不同催化抗体免疫演化的研究表明(最初由 Phil Patten 发起),除了序列多样性外,生殖系抗体库的结构可塑性和由此产生的多特异性,在它们能够以适中亲和力结合几乎无限的分子结构中发挥着重要作用。半抗原与生殖系抗体的结合会诱导 CDR 环和侧链构象重排,增强抗体与半抗原之间的互补性。引入到生殖系抗体中的体细胞突变,尤其是在或远离半抗原结合位点的突变,限制了这种构象灵活性,并在亲和力成熟抗体中产生了“锁与钥”一样的高亲和力结合模式。从诱导契合到“锁与钥”结合模式的过渡,为抗体结合潜力提供了一种额外机制——构象多样性,这超越了简单的序列多样性,解释了体液免疫系统惊人的结合潜力。
基于免疫系统多样性的研究启发了化学家们开发新的合成方法,这些方法开始改变传统化学合成的模式。无论是像抗体催化那样基于免疫学多样性,还是早期的平行化学方法(如 Geysen 的合成肽针技术)都开始改变化学家们对合成具有特定化学、生物或材料性质的分子方式的看法。化学家们不再依赖于反复合成和表征的传统方法,而是像大自然那样,开始构建高效的基于多样性的合成流程,并筛选/选择具有新性质的分子。
我们在伯克利的工作引起了早期硅谷先锋 Alex Zaffaroni 的关注。我和他一起探讨了这些方法将如何改变药物发现的方式。我开始意识到,我们可以利用商业界的资源来扩大科学的影响力。于是我们成立了第一家组合技术公司——Affymax。在那里,我们利用光刻技术构建了大型空间排列的肽库,然后通过基于亲和力的方法筛选出高亲和力的配体。这种技术还促成了在芯片上通过光刻来合成寡核苷酸的技术(以及 Affymetrix 的创立),这在早期的转录组分析中起到了重要作用。Affymax 是噬菌体展示技术的先驱之一。因为除了创建肽库之外,Affymax 还开发了早期的噬菌体展示抗体库。在我于 Affymax 组建的团队中,Mark Gallop 是最早将 DNA 编码库技术付诸实践的成员之一,而 Pim Stemmer 则开发了 DNA 重排技术,这一技术在提高实验室蛋白质进化效率方面迈出了重要一步。与此同时,我实验室的博士后 Jon Ellman 独立构思了使用组合方法合成非寡聚分子的方案,这大大拓宽了组合技术在药物发现中的应用范围。
在伯克利,我对材料科学产生了兴趣(或许这与我过往的有机物理学研究有关)。我很快便意识到,发现新材料的过程往往依赖于过往的经验。换句话说,由于现代固态材料的复杂成分、结构以及掺杂剂和缺陷的影响,科学家们往往需要通过大量的实验和实际操作来发现和优化材料,而不是单纯依靠理论计算或预测。于是我招募了一位材料科学家项晓东(此时他刚从伯克利的物理学博士后岗位回来),我们一起利用溅射和掩模方法,制作了首个可组合、空间可定位的固态材料库(每平方英寸 10,000 个点),并用扫描四探针对这些材料进行了超导性测试(图 2)。
可能是因为我对这个领域较为陌生,或是他们认为这并不符合假设驱动的研究模式,于是当时美国能源部(DOE)不愿为这项工作提供资金。但我成功说服了 HHMI(霍华德·休斯医学研究所),让他们认识到材料在医学中的重要作用(相信自己的直觉,即使这与常规观念相悖)。随后我们开发了更先进的激光剥蚀沉积方法以及扫描探针/成像系统,并将这些工具应用于新型磷光、磁阻和铁电材料的开发。
Alex 和我再次创办了一家公司——Symyx,由 Henry Weinberg 担任首席科学官(CSO),Isy Goldwasser 担任总裁。该公司开发了组合合成和表征方法,这些方法改变了许多化学工业界人士以及现在的学术界对新型异质催化剂、均质催化剂、固态材料和聚合物的寻找方式。为 Symyx 筹集资金面临很大挑战,因为许多投资者和行业领导者对我们的策略以及新材料的需求提出了质疑。不过在我们的坚持之下,最终还是成功筹到了启动资金。最近,我们将这些相同的方法应用于 Wildcat Technologies 的新型锂离子电池正极、负极和电解质的开发,项目由 Dee Strand 领导。Wildcat 实际上制造了“器件库”形式的软包电池,并一次性对数百个电池进行循环测试。这种方法使得他们发现了新的无序岩盐型正极材料,这些材料的能量密度比高镍 NMC 材料高出 15%到 20%,且不含钴或镍,同时在安全性方面也优于当前使用的最佳正极材料(图 2)。那些早期批评这种组合方法在材料科学和药物发现中的应用的人未能理解的是,这些技术真真正正地让我们以更快、实验结果更一致和更具成本效益的方式设计、执行和分析实验。这是一项重要的进步,因为它能够大规模地收集数据。这些数据现在正被用来分析新的化学和材料洞察及原理。
▲ 图 2:(左)空间排列的组合钙钛矿库。(中)Staubli 机器人作为超高通量自动细胞筛选平台的一部分。(右)Wildcat 科技公司的一组袋状锂离子电池在循环。
// 扩展遗传密码的边界
在我们利用基于多样性的合成策略的同时,我们也探讨了是否可以重新编程细胞中高度进化的蛋白质合成机制,以扩展遗传密码本身。除了少数几种含有硒半胱氨酸(selenocysteine)和吡咯赖氨酸(pyrrolysine)的蛋白质外,所有生物体都使用相同的 20 种氨基酸的密码。
为什么偏偏是这 20 种氨基酸?
如果上帝在第七天再多做一点(比如给遗传密码添加例如酮基或醛基侧链),我们将会是什么样子?(而不是依赖于辅酶吡哆醛 cofactor pyridoxal)
虽然中心法则(DNA 中的四种构建块通过 61 种三核苷酸密码子编码了蛋白质中的 20 种氨基酸)被普遍认为是不可改变的,但显然,核糖体和 EF-Tu 可以接受各种氨基酸侧链。因此,我们决定接受这个挑战,尽管许多人(包括我在最初的 NIH 评审小组中的同事)并不看好这个计划。我们的第一次尝试涉及开发一种体外耦合转录/翻译系统,通过化学酶学方法加载非经典氨基酸到 tRNA 上,但真正的目标是通过利用活细胞的翻译机制将新的构建块添加到生命系统中,这个项目当时由年轻且大胆的 David Liu 在我的实验室首次展开。
David Liu
哈佛大学和麻省理工学院博德研究所副所长、哈佛大学自然科学教授与化学和生物化学教授、霍华德·休斯医学研究所研究员、美国科学院院士,是合成生物学领域的知名学者。他的研究方向包括基因组编辑蛋白的工程设计、进化和体内递送,如如用于研究和治疗遗传疾病的 Base editors 和 Prime editors ;利用噬菌体辅助连续进化 (PACE) 技术进化具有新治疗潜力的蛋白质;利用 DNA 模板有机合成和 DNA 编码文库发现具有生物活性的合成小分子和合成聚合物。
为此,我们需要创造新的 tRNA 和氨基酰 tRNA 合成酶(aaRSs),使其能够识别非编码密码子和非经典氨基酸(ncAAs),并且对宿主细胞的内源成分具有高度的生物正交性(即不与宿主 tRNA 和 aaRSs 发生交叉反应),以确保高翻译准确性(图 3)。如今,生物正交性的概念在化学生物学中已经非常普遍和常见,但当时这个概念还处于起步和发展阶段。我们已经确定,使用无义密码子在体外特异性地编码非经典氨基酸这一策略是可行的。因此,必须生成(i)一种特异性翻译无义密码子的 tRNA,但不被宿主细胞中的任何内源性 aaRSs 作为底物使用,以及(ii)一种与该新 tRNA 配对的 aaRS,它能够氨基酰化这种新 tRNA,而不与宿主细胞中的其他 tRNA(如 E. coli 中的 80 种)发生反应。
▲ 图 3:(左)2.0 Å分辨率下大肠杆菌核糖体的复合体结构(右)将 ncAAs 整合到大肠杆菌蛋白中的方案。
更具挑战性的是,工程化/进化这种 aaRS,使其能够识别目标非经典氨基酸,而不识别宿主细胞中的任何内源性氨基酸。最后,非经典氨基酸必须以合理的浓度进入宿主细胞质中,并且不具有细胞毒性。一个关键的发现是,tRNA 与其配对合成酶的识别涉及到在细菌中保守的受体茎(acceptor stem)相互作用,但与古菌和真核生物中的相互作用不同。考虑到这一点,我们选择了古菌 Methanococcus jannaschii (Mj) tRNA(Tyr)/MjTyrRS 对作为我们第一个候选的正交细菌对。尽管如此,仍然需要通过一系列正向和负向筛选来提高这种 tRNA 的生物正交性。
接下来的挑战是改变 aaRS 的特异性,使其能够识别目标非经典氨基酸而不识别宿主中的内源性氨基酸。为实现这一目标,王磊开发了一种用于基因编码非经典氨基酸(ncAA)的两步选择性方案。该方案可以从基于结构的 aaRS 活性位点突变体库中,筛选出能够在无义密码子(UAG)的非特定位点插入非经典氨基酸(ncAA)的合成酶,将非经典氨基酸整合到一个必需蛋白中。负选择步骤是在没有 ncAA 的情况下,无义密码子(UAG)会产生致死的蛋白质。正选择步骤则是在有 ncAA 时,能够有效地抑制 UAG,从而使蛋白质正常合成。这个正负选择方案非常有效,使我们实验室及许多其他实验室能够在细菌和哺乳动物细胞中以优秀的效率、准确性和产量(分别达到 11 克/升和 3 克/升)进行非经典氨基酸的基因编码。
我们使用了类似的策略,并结合了病毒和其他传递方法,成功在包括酵母、线虫、果蝇和哺乳动物细胞在内的高等生物中,建立了生物正交对,实现了非天然氨基酸的基因编码。此外,我们还通过基因编码和生物合成的方法,成功创造出了一种能自主合成第21种氨基酸(对氨基苯丙氨酸)的细菌。最近,我们还将第 21 种氨基酸添加到人类造血干细胞的基因组里,并将这些细胞移植到小鼠体内。我们计划用免疫原对这些小鼠进行免疫挑战,观察是否通过克隆选择产生的成熟抗体在其可变区域中包含非经典氨基酸(ncAA)。
基因编码非经典氨基酸技术已经使我的实验室及许多其他实验室能够基因编码超过 300 种结构多样的非经典氨基酸(该项技术的推广和应用得到了 GCE4All 研讨会的支持和推动)(图 4)。我们和其他研究者发现,除了氨基酸侧链外,我们还可以对蛋白质骨架进行改造。例如引入α-羟基酸,这有可能允许合成模板化的非天然生物聚合物(如类似 PLGA 的聚合物)。
X 射线晶体结构解析显示,几种进化后的合成酶的活性位点具有很高的结构可塑性(这种特性类似于生殖系抗体),这在很大程度上解释了为什么我们能够相对容易地改变它们的特异性。显然,一些进化后的合成酶以及那些自然进化以编码吡咯赖氨酸的某些甲烷菌,都具有多特异性(即它们可以用多个不同的非经典氨基酸氨酰化其配对的 tRNA,但通常不使用常见的 20 种氨基酸作为底物)。这些多特异性的氨基酸合成酶成为生成多种不同非经典氨基酸的氨基酸合成酶(aaRS)的重要起始点。
▲ 图 4:基因编码氨基酸的例子。
基因编码氨基酸中最有用的一类是那些具有生物正交化学反应性的氨基酸。这些基因编码的化学反应包括醛胺反应、"点击"化学、异硫氰酸盐耦合、Diels−Alder 反应、Michael 加成反应、交叉耦合、烯烃复分解反应和氟硫酸盐加成反应。这些化学反应可以用来在体外和体内成像实验对蛋白质进行位点特异性标记,这些是 GFP 融合蛋白无法实现的。
其中一种最早且最可靠的生物正交反应是基于基因编码的对乙酰苯丙氨酸(pAcF)。这种氨基酸能够有选择性地与烷氧基胺发生反应,因此可以在特定位置对蛋白质进行修饰,加入生物物理探针、长链聚乙二醇、珠子、树脂、多肽、寡核苷酸和药物等。实际上在 Ambrx 等公司推动下,目前已有八种这样的药物候选物进入了人体临床试验阶段。这种方法的精确化学特性使得我们能够优化生物药品的半衰期、疗效和安全性,这与药物化学家在小分子药物开发中的做法类似。我们当时在 Ambrx(现已成为强生的一部分)利用这种方法合成了位点特异性抗体-药物偶联物(ADC)。事实上,由我和 Feng Tian 指导开发的两种 Ambrx ADC 在 Her2 阳性乳腺癌和前列腺癌患者中展示了非常优秀的临床结果,很有可能成为该病未来的最佳疗法。Sutro 公司也使用了正交 tRNA/aaRS 对,开发了一种用于卵巢癌的先进临床阶段 ADC,AstraZeneca 正在利用这项技术开发下一代 ADC。非经典氨基酸还被用于在必需蛋白质中创建生物正交的蛋白质界面,使得生物体对这些非经典氨基酸的生存产生依赖性。我们已将这一方法应用于开发条件性活疫苗。另一种非经典氨基酸的新应用是利用免疫原性氨基酸来突破对宿主蛋白的耐受性。总体而言,这些进化后的氨基酸合成酶已被广泛分发给科学界(仅我实验室就分发了超过 2500 次),用于探究蛋白质的结构与功能,并工程化蛋白质以赋予其新功能。
我们和其他研究小组成功地利用 UAG 和 UAA 两种无义密码子,配对相互正交的 tRNA/aaRS 对,高效地将两种不同的非经典氨基酸(ncAAs)引入到了蛋白质中。为了获取除自然终止密码子之外的更多密码子,我们设计了一种四碱基密码子与其对应的 tRNA 对。为了确保这种新密码子能够有效地工作,我们对 tRNA 进行了体外进化,使其能够高效地识别并使用这个新密码子。紧接着,我们进一步改进了这一策略,将四碱基密码子设计为 TAGX(X = G, C, T, A)。这是因为 Church 实验室对大肠杆菌基因组进行了改造,他们把其终止密码子 TAG 全部替换为 TAA。这使得与 TAGX 四碱基移码翻译竞争的释放因子 RF1 得以移除。最近,Chin 实验室还去除了细菌遗传密码中的两个 Ser 密码子,并将这些密码子重新分配给非经典氨基酸(ncAAs)。
我们还与 Floyd Romesberg 合作探索了另一种策略:通过扩展遗传密码本身来生成全新的密码子。我们合成了一个第三种选择性、稳定的碱基对,这种碱基对在水环境中形成稳定的自配对,但不会与含有氢键基团的碱基配对。这种基于疏水性的碱基对与 Watson−Crick G-C 和 A-T 碱基对具有相似的稳定性和选择性,能够被 DNA 聚合酶有选择性地引入到 DNA 中。令人印象深刻的是,Floyd 团队在已有的研究基础上,独立地开发了一种新类型的碱基对——疏水性碱基对,并能够将其引入到细菌质粒中,用于编码非经典氨基酸(ncAA)。
回过头来看,尽管遗传密码在进化过程中被保守地传递到所有生命界,但实际上,向遗传密码中添加新的构建模块出乎意料地简单。这引发了我的一个疑问:如果生物体能够利用额外的非经典氨基酸,这是否会给它们带来进化上的优势?为了解决这个问题,我们将细菌暴露在各种选择压力下进行进化测试,向其提供非经典氨基酸,并观察细菌如何应对这些挑战。例如在一个实验中,我们生成了一种蛋白质,我们在这个蛋白中引入一个非经典氨基酸的突变,使得蛋白质 metA 的热稳定性提高了显著的 21°C,使其能够在之前无法生长的温度下存活。在其他实验中,非经典氨基酸已被证明能提高酶的催化活性,改善噬菌体的生长表现,并提高与抗体和肽的结合能力。最近我们开发了一种新的方法,通过随机插入非经典氨基酸到蛋白质中,筛选出具有增强或新颖特性的蛋白质,例如具有特定功能的共价抗体。
但最初困扰我的问题仍然存在——为什么最初的 20 种氨基酸会被保留?或者说,为什么自然界坚持使用最初的 20 种氨基酸?明明非经典氨基酸能够为生物体的进化挑战提供独特的解决方案,而且向遗传密码中添加更多构建模块也并不困难。
随着这一领域的不断发展,我们可以预见,未来将会有科研人员使用一系列正交 aaRSs(氨基酸合成酶)来合成全新的非自然聚合物,制造具有大侧链的化合物,开发基因组经过重编程的生物体,这些生物体能够编码 21 种或更多的氨基酸并具有自我进化能力;此外,还可以在胚胎干细胞(或诱导性多能干细胞)及其后代中编码 21 种氨基酸,并设计新一代具有优化药理特性的蛋白质-药物偶联物。如今,我们已经打破了由中心法则十亿年来施加的限制,我们开始能够合成具有具有全新功能的蛋白质,甚至是整个生物体,而这些新生物体的性质将不再受限于传统的 20 种氨基酸!这一工作拓展了合成化学的领域,化学家们现在可以操控大规模复杂系统,创造传统化学或生物学方法难以获得的新型大分子结构。
// 合成生物学近期研究
若要实现上述美好的技术畅想,我们需要构建大量的 tRNA 和氨基酸合成酶突变体库,并从中筛选出具有新功能的突变体。虽然这一技术很强大,但它需要生成突变体库,将其转化为选择系统,鉴定出具有改良特性的克隆,分离出相应的基因,然后不断重复这一过程,直到获得所需的表型。虽然 DNA 重排技术提高了这一过程的效率,但使用正交复制系统是一种更高效的方法。在这种系统中,基因可以以较高的错误率进行复制,而不受宿主基因组的影响。这种系统允许在细胞分裂的每一轮中持续生成和筛选突变体,同时不影响宿主细胞的存活。如果在大肠杆菌中使用这种复制系统,理论上可以在一周内完成 300 多轮的突变和筛选。最早这类方案是由我的前同事们提出的,一个是由刘畅基于酵母细胞质蛋白启动的 DNA 复制系统,另一个方案则是 David Liu 基于噬菌体在细菌中开发的系统。最近,Jason Chin 还开发了一种基于 PDR1 噬菌体的正交复制系统,用于细菌研究。(他们都是非常有才华的前同事)
尽管这些系统已经非常强大,但我认为一个理想的系统应具备高错误率(比基因组复制的错误率高 10 万倍)、高转化效率(从而使大型文库可以作为起点)、并且应具有快速的倍增时间,还应能充分利用细菌遗传学中稳健的重组技术和筛选系统。
为此,我和 Christian Diercks 最近在大肠杆菌中开发了一种正交 DNA 复制系统,该系统基于对噬菌体 T7 复制体(由 T7 DNA 聚合酶、T7 RNA 聚合酶-溶菌酶融合蛋白、T7 单链 DNA 结合蛋白和突变的 T7 引物酶/解旋酶)的受控细菌表达(图 5)。随后的 T7 DNA 聚合酶的定向进化筛选出了高度突变的克隆体,其突变率比基因组突变率高达 10 万倍。该系统能够维持环状质粒,同时具备高转化效率,并能将复制系统无缝整合到大肠杆菌的标准分子生物学工作流程中,而不会影响自身的复制。我们通过该诱变系统成功加速了基因的进化。这使得我们在一周内,成功将 TEM-1 β-内酰胺酶对几种单菌霉素和头孢菌素类抗生素的活性提高了约 1000 倍,这相当于几十年来关于广谱β-内酰胺酶的研究进展。目前,我们正在将这项技术应用于高亲和力纳米抗体、酶和病毒递送系统的快速进化研究。
▲ 图 5:基于 T7 的正交复制系统。
最近,我们开始思考是否可以从进化的角度“往回看”,通过缩减遗传密码而不是扩展它。换句话说,我们可以“反向”进化,通过删减密码子的方式让遗传信息变得更简单。于是,我们使用丝状噬菌体作为模型系统,尝试看看如果从蛋白质中去掉重要的氨基酸(蛋氨酸),生物还能否正常工作。因为有一种假设认为蛋氨酸(Met)是遗传密码中最后加入的氨基酸之一。由于蛋氨酸在空间结构和电子性质上与亮氨酸(Leu)相近,因此或许可以被替代。迄今为止,我们已经证实,M13 噬菌体基因组中的 24 个翻译延伸过程中的蛋氨酸都可以被其他常规氨基酸所取代。
虽然合成基因组的直接转移看似简单,但成功案例较少,而逐步替换则可避免操作大型 DNA 的困难,并有助于识别设计中的潜在缺陷。综合来看,合成基因组的构建是一个复杂的过程。作者认为关键点是在从头构建合成基因组的过程中,可能没有单一最佳方法能满足所有需求,而采用不同方法的组合和灵活调整将提供最佳结果。
进化中的另一个重大事件是线粒体在真核生物中的出现。线粒体进化的内共生理论描述了这样一个过程:古细胞吞噬了细菌,最终演化为现代的线粒体。从细菌演化为线粒体的遗传前提条件包括基因组的大幅缩减、细胞壁的消失、蛋白质在线粒体内外的重新定位,以及促进细菌和宿主共存的基因水平转移。要验证这一系列假设的事件,最终方法是将这些进化步骤在合成模型系统中再现。为此,我和 Angad Metha、Lubica Supekova 设计了一个实验系统,使用模式细菌大肠杆菌和真核生物酿酒酵母,在实验室中研究内共生的进化过程。我们删除了 nadA 基因,让缺乏 NAD⁺(一种重要的辅酶)的大肠杆菌被改造后,通过 ADP/ATP 转运蛋白输出 ATP,为酵母提供能量。同时,我们通过破坏环氧合酶 -2 (COX2) 基因,构建出线粒体功能缺陷的酿酒酵母,使其无法在含有不可发酵碳源的培养基中生长。我们发现,在大肠杆菌中表达类似 SNARE 的蛋白质也是必要的,这样可以防止酵母细胞清除细胞质中的大肠杆菌。通过使用 PEG 融合技术,我们将缺失 nadA 的大肠杆菌与酿酒酵母融合,形成了可以存活至 4 次传代的内共生体,随后内共生体释放出细菌。最近,我们在三个关键基因 rcsC、cpxA 和 idnK 中发现了转座子插入,这些插入显著增强了内共生体在传代中的稳定性,即提高了其稳定共存的能力。这些突变能通过调节细菌在酵母胞质中高渗透压环境下的生长,并通过上调防御性应激反应机制发挥作用。这些合成的内共生体还使我们能够初步研究在酵母宿主中细菌基因组的缩减可能性,包括移除氨基酸和辅因子生物合成途径。我们现在正在利用大规模转座子介导的突变和 L 形细菌(Lister 形态,细胞壁缺陷)策略,进一步缩减细菌基因组。
// 药物发现和化学生物学
我在创立诺华研究基金会基因组研究所(GNF)时,偶然间对药物发现产生了兴趣。那时,我的实验室也恰好在 1999 年搬迁到了 Scripps 研究所。这一契机使我开始涉足药物开发领域。创立 GNF 的初衷是希望通过开发和应用高通量技术来探索细胞信号通路和调控机制,这些机制可以为药物研发提供全新的靶点。我们向科学界提供了第一个大规模的转录组基因图谱,这是 John Hogenesch 领导的一个项目。我们还通过采用汽车制造行业使用的稳定机器人技术(例如如今在生命科学中常见的黄色 Staubli 机器人,图 2),开发了高通量表型细胞筛选方法。这一技术开发由前通用汽车首席工程师 Rob Downs 和年轻的细胞生物学家 Jeremy Caldwell 共同领导。我们利用这些工具(后来被制药公司和美国国立卫生研究院广泛采用)对数百万个化合物进行了化学库筛选,筛选了数千个基因的 siRNA 敲减和过表达,以及分泌蛋白的筛选,以发现新的细胞活性。我们还与 Ray Stevens 和 Scott Lesley 合作,开发了首个基于微晶的自动化结构基因组学工具,这一系统后来促成了 Symyx 公司的诞生。
GNF 的年度预算迅速超出了最初的预期,这一增长部分得益于诺华董事会主席 Jorg Reinhardt 的支持。他曾询问我们是否可以将这种技术用于药物开发,这对我们来说是一个有趣的挑战,激发了我们设计和制造大型激酶抑制剂文库的想法。于是我们在一位名叫 Nathaniel Gray 的年轻科学家的帮助下开始着手进行这项工作,并在早期参与了激酶定向文库的开发工作(他曾在我的实验室获得 phd 学位)。其中我们开发的一种药物后来成为首个针对 NMP-ALK 融合癌症的候选药物之一。在接下来的 6 年时间里,我们成功将大约 15 个候选药物推进到了临床阶段,其中包括用于治疗癌症、传染性疾病、免疫性疾病和退行性疾病的药物。重要的是,我们开发的高通量筛选(HTS)工具和拥有上百万种化合物的文库,使我们能够以相对较低的成本迅速开展大量的细胞筛选,识别出多个潜在的药物研发起点。这使得我们能够探索更多创新但具有风险的想法,而这些在当时使用诺华的传统工具是难以实现的。
这一药物发现的尝试扩展到了我在斯克里普斯的实验室。我们决定专注于一个当时生物技术和制药公司尚未深入研究的前沿领域——再生医学,这一工作由丁胜和 Xu Wu 发起。我们的目标并不是开发干细胞疗法,而是寻找能够在体内调控内源性干细胞命运的类药分子。由于当时我们对如何靶向调控干细胞自我更新和选择性分化的蛋白质了解甚少,因此我们采用了一种化学生物学的方法,通过基于图像的细胞筛选来进行药物筛选。
在早期的研究中,我们通过表型筛选发现了一种 Smoothened 激动剂,这种激动剂能够选择性地诱导间充质干细胞(MSCs)分化为成骨细胞。接下来,我们又发现了一种芳基烃受体拮抗剂,这种分子能够有选择性地扩增用于骨髓移植的脐带血造血干细胞(该项目后来由诺华推进到了临床阶段)。紧接着,我们发现了一种能够诱导 MSCs 分化为软骨细胞并在骨关节炎动物模型中生成软骨的分子。该分子通过与 filamin A 结合并破坏其与转录因子核心结合因子β亚基(CBFβ)的相互作用起作用,从而调节了 CBFβ-RUNX1 的转录程序。基于这一研究,诺华启动了一个用于修复创伤性关节损伤的临床项目。我们还发现了另一种分子,它能够有选择性地诱导少突胶质细胞前体分化为少突胶质细胞,这一发现引发了人们对其治疗多发性硬化症的浓厚兴趣。最近,我们与 Mike Bollong 的合作中发现了几种分子,它们不仅能够抑制纤维化中成肌纤维细胞的转分化,还能够通过防止自分泌因子的降解,有选择性地扩增肺部干细胞(AEC2 细胞)。
最近,我们还开发了一种雾化肺部用药的候选分子,该药物在多种肺损伤模型中(包括博来霉素、弹性蛋白酶、吸烟、LPS 模型)显示出了活性,并将很快进入特发性肺纤维化的临床试验。我们还发现了一些能够通过两种独特机制激活 TEAD-YAP 转录程序的分子。其中一种分子在心力衰竭的动物模型中通过心包注射选择性地输送到心脏,结果显示心肌梗死面积显著减少,纤维化降低,射血分数也显著改善。分子即将进入 IND(新药临床试验申请)阶段,作为一种可能的心脏修复转化疗法。我们还发现了一些能够扩增视网膜色素上皮细胞并修复创伤的分子。在每种情况下,我们都是通过无偏见的细胞筛选发现这些活性分子的(这些筛选方法常被不公正地批评为没有假设驱动,但实际上是基于发现的研究),随后我们通过结合基因组学、蛋白质组学和基于亲和力的方法解析了它们的靶点。这些项目及其他类似的项目为医学带来了新的机遇,不仅仅是减缓疾病进程,还能逆转疾病和衰老带来的损伤。这些类药分子还揭示了控制干细胞自我更新和选择性分化的新途径和机制。实验室还探索了其他有趣的化学生物学挑战,包括与 Steve Kay 合作发现能够调节昼夜节律的分子,以及与 Ron DePinho 合作,发现能够激活端粒酶以缓解衰老影响的分子,和能够通过此前未知机制激活细胞应激反应通路的分子。Ardem Patapoutian 和我甚至曾尝试筛选 TRPM8 小分子激活剂,想通过这些分子让常温啤酒喝起来像冰镇啤酒一样凉爽,但我们“绿色化学”的尝试失败了。
诺华研究基金会基因组研究所(GNF)在这些年来取得了巨大的成功,因此诺华决定将其纳入公司内部。GNF 的经验为我们提供了宝贵的经验,促成了 2013 年非营利转化科学研究所 Calibr 的成立。现在,Calibr 已经成为 Crispps 研究所旗下的 Calibr-Skaggs 创新医学研究所的一部分。Calibr 已经有 9 个项目进入了临床开发阶段,另有 5 个项目正在进行 IND(新药临床试验申请)研究,此外还有约 50 个早期项目,这在非营利性研究机构中是前所未有的生产力水平。
这些工作由 Arnab Chatterjee、Travis Young、Sean Joseph、Case McNamara、Kristen Johnson、Jing Li、Matt Tremblay 和 Weijun Shen 领导的团队推动。这些项目包括:一种长效小分子药物,用于治疗或预防 HIV 传播;一种可能显著缩短结核病治疗时间的药物;用于治疗血液癌症、实体肿瘤和自身免疫性疾病的可切换 CAR-T 细胞疗法;用于治疗溃疡性结肠炎、肥胖症和非酒精性脂肪性肝炎(NASH)的口服肽类和抗体类单/双激动剂;用于脑疾病的调节性 T 细胞诱导剂;用于膀胱癌的 STING 激动剂;以及针对冠状病毒大流行和流感的候选药物,等等。这一工作得到了来自各类基金会和制药公司的广泛支持,包括最早来自默克公司(Merck)的资金支持,现如今则由艾伯维(AbbVie)和吉利德(Gilead)提供资金。Calibr 的一个重要研究重点是全球健康问题,包括大流行病应对措施,这得到了比尔和梅琳达·盖茨基金会(Bill and Melinda Gates Foundation)的慷慨资助与支持(比尔·盖茨是慈善界的一个激励人心的榜样)。作为这一工作的一部分,我们建立了 ReFRAME 药物库,这是全球最大的已批准或处于临床阶段药物的集合(超过 13,000 种),用于药物再利用,并免费向科学界开放。这使得一系列新药和再利用药物能够快速进入临床,用于多种疾病的治疗。
总而言之,我有幸带领了许多杰出的科学家团队,将大约 30 个项目推进到临床或获得 FDA 批准。与大多数从学术界转入制药行业的学者不同,我得到了从基础开始学习药物发现的独特机会。这种追求尤其令人满足,尤其当这些药物对我亲近的朋友和家人产生了影响时,这更加深了我对制药和生物技术行业中所有在医学前沿奋战者的敬意和赞赏。
// 结论与展望
除了前面提到的工作之外,我们多年来还投入了大量的精力在其他领域,比如半合成序列特异性 DNase 和 RNase 的研究,以及首个 DNA 支架的纳米晶体阵列的开发,还包括设计小分子蛋白质开关和单分子光谱技术等。我最大的遗憾可能是那些因为认为风险太大而没有追求的想法。科学家,尤其是年轻科学家,应该像《夺宝奇兵3》最后一幕中的印第安纳·琼斯那样,勇于迈向未知,坚定地相信前方会有通往成功的桥梁。而年长的科学家则应通过指导、公共服务等方式回馈学界,帮助培养下一代科学家。但愿通过多年的本科和研究生教学、指导同事、在董事会任职,以及担任斯克里普斯研究所的总裁兼首席执行官等方式,我已经履行了这一责任。
如今斯克里普斯研究所正处于良好的发展轨道上,我们正在构建一种新的非营利研究所模式,在这一模式下,我们不仅推动基础研究的前沿,还加速将新的科研发现转化为创新药物,直接造福患者和公共健康(通过我们旗下的 Calibr-Skaggs 转化部门)。这种“商业模式”的一个重要方面是,通过与合作伙伴共同推进临床阶段药物开发所获得的许可收入,能够重新投资于研究机构,创建一个自良好的机构自我运转模式,支持那些通常不被保守的联邦机构认可的高风险、高回报的创新研究。
最后,现代生物学工具与细胞的合成机制相结合,再加上传统的化学工具,使我们得以创造具有全新特性的分子、小分子和复杂的分子系统,这些特性仅依靠化学方法难以实现。这些努力不仅极大地扩展了我们作为化学家能够处理的分子和分子系统的复杂性,还对我们在分子层面对生物学的理解产生了深远的影响,进而推动了新药物的开发,用于治疗人类疾病。尽管如此,在我的职业生涯中,最重要和最有成就感的部分,还是我有幸能够指导一群非常有才华且充满乐趣的同事们(尽管其中一些人后来反过来指导了我),而他们也在科学及相关领域中开创了各自高度成功且富有影响力的职业生涯。
我对他们感激不尽,并期待我们下次的重聚。
\ END \