定量解析秀丽隐杆线虫早期胚胎发育中的细胞命运

科技   2024-11-03 00:00   上海  

Quantitative Resolving Cell Fate in the Early Embryogenesis of Caenorhabditis elegans

定量解析秀丽隐杆线虫早期胚胎发育中的细胞命运

https://www.biorxiv.org/content/10.1101/2024.10.25.620330v1.full.pdf



摘要

线虫秀丽隐杆线虫在其发育过程中展现出不变的细胞系谱,其中调控发育的基因-分子网络至关重要,对生物过程具有决定性作用。尽管有许多分子细胞图谱描述了细胞转化现象和关键分子,但从系统生物学角度探究其背后的机制却鲜有关注。基于将分子机制与生物表型联系起来的内源性分子-细胞理论,我们构建了一个核心内源性网络模型,用以描述线虫早期胚胎发育阶段。从合子到创始细胞的发育过程中的不同细胞类型和中间细胞状态对应于非线性随机动态系统的稳态。稳态之间的连接形成了一个拓扑景观,包含了已知的发育系谱轨迹。通过调节网络中因子的表达,我们定量模拟了Wnt和Notch信号通路对细胞命运转变的影响,并预测了AB细胞在系谱中可能的转分化轨迹。当前研究的成功可能有助于推进我们对发育生物学和细胞命运决定基本原理的理解,并为细胞过程的定量分析提供了一个有效的工具。

关键词:秀丽隐杆线虫,胚胎发育,内源性网络,景观,随机动态


引言

一个生物体的发育通常从一个单细胞开始,受精卵经历多次分裂产生数百万细胞,这些细胞分化并组织成组织和器官。尽管这些细胞共享相同的基因组,它们却分化成执行复杂多样的生理功能的细胞。理解胚胎发生过程中细胞命运的遗传调控对于揭示发育的一般原理至关重要(Wolpert等人,2019年;Wang等人,2020年)。人们认为,一些普遍的发育原理适用于所有动物,这使得研究少数模型生物对于阐明广泛物种上的类似过程具有不可估量的价值。在这些模型生物中,秀丽隐杆线虫(Caenorhabditis elegans,简称C. elegans)是发育生物学中的一个重要模型生物。它是唯一一个每个细胞都已被特征化的多细胞生物,并且它具有一个持久的细胞系谱(Sulston等人,1983年;Kimble和Nüsslein-Volhard,2022年),其中包含了在更高等生物中发现的所有基本细胞类型的完整集合。

随着人类基因组计划的完成和高通量组学分析技术的快速发展,如单细胞RNA测序(scRNA-seq)和细胞系谱追踪,目前的焦点已经转移到分子细胞图谱上(Quake,2022年)。有许多研究利用scRNA-seq探索C. elegans的转录组。C. elegans L2幼虫阶段的单细胞转录组已经被很好地特征化(Cao等人,2017年),同时构建了早期胚胎发育各个阶段的细胞图谱(Tintori等人,2016年;Packer等人,2019年;Cole等人,2024年)和时空图谱(Cao,2020年;Ma等人,2021年)。虽然根据形态、生理功能和分子结构等标准对细胞类型进行分类会产生大量数据和信息(Regev等人,2017年),但在复杂的多细胞生物中记录每个细胞的这些特征是不切实际的。然而,一个像现实一样详细的图谱可能会令人不知所措,并不一定有帮助(Ao,2008年)。因此,识别一些可以简化和统一我们对这些复杂生物系统理解的通用方法是至关重要的。

在发育阶段,细胞通过不同的命运决定达到它们最终的分化类型。探索这一过程中细胞状态的变化有助于理解不同细胞类型之间的关系。Waddington的表观遗传景观将发育中的细胞概念化为滚下山坡的球,其中山顶代表祖细胞,山谷对应于具有不同分化潜力的不同细胞类型(Waddington 1957)。这些山坡的形状由基因调控网络决定(Waddington 1957)。对于秀丽隐杆线虫的发育过程,Murray等人总结了不同系谱命运的关键调控因子(Murray等人,2012年;Liu和Murray,2023年),而Maduro等人建立了一个在胚胎发育期间控制内胚层和中胚层细胞命运特化的基因调控网络(Maduro,2009年;Maduro,2010年)。Du等人开发了一个多尺度模型,该模型整合了调控网络与细胞系谱信息(Du等人,2014年;Du等人,2015年)。然而,这些研究主要是描述性的,尚未充分阐明推动细胞命运决定的潜在调控机制。正如将秀丽隐杆线虫引入发育生物学研究的诺贝尔奖得主Sydney Brenner在他的诺贝尔讲座中解释的那样,“我们需要将数据转化为知识,我们需要一个框架来实现这一点”(Brenner,2003年)。

不同秀丽隐杆线虫系谱的细胞命运在胚胎发育的早期阶段就已经确定:受精卵经历第一次不对称分裂形成前部的AB细胞和后部的P1细胞。AB细胞随后分裂成ABa和ABp细胞,这些细胞产生表皮细胞、神经元、肌肉和其他特化细胞。P1细胞分裂形成EMS和P2细胞。EMS细胞导致秀丽隐杆线虫的内胚层和中胚层,并进一步分裂成MS细胞。后者产生肌肉、腺体、血细胞和E细胞,这些细胞形成肠道。P2细胞经历两次额外的分裂,形成C和D细胞,这些细胞与产生生殖细胞的P4细胞一起产生各种组织(Wolpert等人,2019年)。尽管秀丽隐杆线虫具有一致的细胞系谱,每个发育阶段的细胞命运都有详细记录,但这并不意味着细胞分化总是遵循相同的轨迹(Rothman和Jarriault,2019年),因为基因、蛋白质和细胞之间的复杂相互作用推动了胚胎发育。因此,秀丽隐杆线虫早期胚胎发育中的细胞命运决定是研究这些因素如何设定发育的理想对象。


在这项研究中,我们构建了秀丽隐杆线虫早期胚胎发育的核心内源性网络,其中蛋白质和基因之间的相互作用被建模为一个高维非线性随机动态系统。计算分析恢复了对应于五个创始细胞(AB、MS、E、C、D)、干细胞(P1-P4)以及几个子代细胞(ABa、ABp、Z2/Z3)的表达谱的稳态,以及代表中间细胞状态的一系列过渡态。通过追踪从过渡态到稳态的演化轨迹,可以绘制出秀丽隐杆线虫早期胚胎发育的拓扑景观,这包括正常的发育路径以及尚未记录的细胞间转换路径。这些结果独立于高通量数据,允许预测中间细胞状态和转分化路径,这些在实验中尚未观察到。此外,通过调节特定因子的表达,可以诱导不同状态之间的细胞转换,为扩展框架提供了一个计算基础,可能为研究例如其他物种的动物发育提供了一种定量方法。


材料和方法

 1. 内源性网络构建

Ao、Hood等人提出的内源性网络建模提出了一种从系统生物学角度描述生物系统中复杂分子调控机制的替代方法,通过随机动态学促进定量分析(Ao等人,2008年)。该理论认为,由数十亿年生物进化塑造的内源性分子-细胞网络可以通过关键内源性因子的表达或活性水平定量表示,形成一个高维随机动态系统。网络因子之间的非线性相互作用和动态相互作用导致多个局部稳定状态,每个状态具有不同的生物学功能网络动态自主地实现并在较长时期内维持这些稳态。生化反应中固有的随机性在稳态之间通过景观障碍的转换,对应于分化过程中的细胞状态变化。识别内源性网络中的关键因子,详细描述它们的相互作用,并阐明它们的全局动态特性,可以系统地揭示正常和异常组织功能背后的机制(Yuan等人,2017年)。

为了构建特定研究的内源性网络,首先需要根据要描述的生物现象和功能选择模块。这些功能模块是生物系统的不可分割但相对独立的组成部分,它们可以独立执行模块功能,或者通过复杂的串话共同执行细胞命运决定(Hartwell等人,1999年)。在这项研究中,我们将重点关注早期胚胎发育阶段,特别是从受精到创始细胞生成的初始细胞分裂(Wood,1988年)。基于这一阶段细胞的功能角色,我们选择了四个关键模块:细胞极性、细胞周期、信号通路和系谱特化,以及每个模块的核心因子和它们之间的相互作用。在当前背景下,网络中的一个因子(即节点)通常可以代表一组相关的基因/分子和/或一个信号通路。这些基因或蛋白质通过转录、翻译或信号传导直接或间接地相互调控,因此我们采取粗粒度的方法将这些调控抽象为“激活”或“抑制”相互作用。

在不对称细胞分裂过程中,细胞极性主要由PAR极性蛋白控制(Bowerman et al. 1997)。以下PAR-6代表前部蛋白复合体PAR-6/PAR-3/PKC-3,而LGL-1代表后部复合体LGL-1/PAR-1/PAR-2(Hoege和Hyman 2013; Rose和Gönczy 2014),PLK-1代表复合体PLK-1/MEX-3/MEX-5,该复合体将极性蛋白与细胞质中因子的不对称分布联系起来(Budirahardja和Gönczy 2008)。AB细胞的子代细胞分裂速度比P1细胞的子代细胞快。Cdc-25.1和CDK-1被选为代表细胞周期的促进因子,而WEE-1.1代表抑制因子(Van Den Heuvel 2005; Tavernier等人 2015; Kipreos和Van Den Heuvel 2019)。在AB和EMS分裂产生子代细胞的过程中,涉及两个关键的细胞间信号转导。GLP-1作为受体,代表Notch信号通路,而TCF转录因子POP-1代表Wnt信号通路(Mello等人 1994; Phillips等人 2007)。决定细胞分化的关键因素包括母体转录因子,如SKN-1用于中胚层和内胚层的特化(Bowerman等人 1992; Bowerman等人 1993; Gilbert和Barresi 2016),PIE-1用于生殖细胞命运(Mello等人 1996; Gilbert和Barresi 2016),以及PAL-1用于P2分裂球细胞的体细胞后代(Hunter和Kenyon 1996; Edgar等人 2001; Gilbert和Barresi 2016)。此外,系谱特异性因子包括TBX-35和TBX-37用于中胚层(Good等人 2004; Broitman-Maduro等人 2006),PHA-4用于咽部(Kalb等人 1998; Kiefer等人 2007),HLH-1用于肌肉(Fukushige和Krause 2005; Fukushige等人 2006),END-3用于肠道内胚层(Zhu等人 1997; Ewe等人 2022),以及LIN-26用于外胚层(Labouesse等人 1996)。上述因子列在补充材料的表S1中,以及它们相关的模块。它们之间的相互作用进一步在图1a中说明。


2. 非平衡随机动力学

内源性网络中N个因子的动态,其表达或活动水平表示为,可以通过一组随机微分方程(SDEs)来表示:

使用这种方法计算的稳态分布的固定点与在没有噪声的情况下常微分方程(ODEs)的固定点相吻合,允许对内源性网络进行定量分析,其维度范围从几十到几百。现在取方程 的确定性部分,可以使用Hill函数的形式模拟其他因子的激活和抑制对第 i 个因子速率的影响,

在极端极限下,当 n 接近无穷大时,微分方程从Sigmoid形式转变为步进函数,转换为一组离散的布尔运算。例如,网络中因子PAR-6的调控关系的布尔表达式为 PAR-6(t+1) = (CDC-25.1(t) OR CDK-1(t)) AND (NOT LGL-1(t))。布尔动力学是捕捉网络整体结构信息的强大工具,为非线性动态行为提供了稳健的近似。这种方法在描述和分析复杂生物系统方面有广泛的应用(Bornholdt 2008; Albert 和 Thakar 2014)。将ODE动态与布尔动态进行比较,可以测试两种方法的有效性,并识别布尔动态单独无法计算的鞍点。这再次证实了系统在核心内源性网络层面的动态结构在很大程度上是不敏感于参数的,即主要由网络的拓扑结构决定。


  1. 常微分方程(ODEs)的固定点

    我们使用了两种不同的方法来识别非线性常微分方程(ODEs)的固定点。




结果

1. 秀丽隐杆线虫内源性网络模拟

为了定量探索秀丽隐杆线虫早期胚胎发育中细胞命运决策的机制,我们构建了专门针对这一阶段的核心内源性网络,涉及的相关模块和核心因子及其之间的相互作用如图1a所示。这是一个封闭系统,每个因子都受到其他因子的调控,形成反馈循环,没有纯粹的上游-下游关系。它有能力做出自己的决策,并能随时间演化到具有不同生物表型的稳定状态。

如方法部分所述,网络动态可以通过一组非线性常微分方程(ODEs)进行建模分析。进行模拟后,我们获得了10个稳定状态和33个过渡状态,它们对应的表达谱分别显示在图2a和2b中。另外,布尔动力学对初始状态遍历产生了18个吸引子,包括10个点吸引子和8个线吸引子,如图2c所示。这10个点吸引子与通过ODE分析获得的10个稳态谱相匹配。此外,线吸引子对应于过渡状态的一个子集,确认了这两种计算方法之间的一致性,如方法部分所讨论的。


2. 通过实验数据识别的表型

每个稳态的生物学特征最初是基于与每种细胞类型相关的特定标记因子的表达来确定的。S1和S4(稳态)都表现出后部因子LGL-1和生殖细胞因子PIE-1的高表达,表明它们对应于P系细胞。此外,在S1中,促进细胞周期的因子高度表达,而抑制因子的水平保持低水平,而在S4中,这种模式是相反的。因此,S1被识别为P1-P4细胞,这些细胞在早期发育过程中持续分裂,具有干细胞特征,而S4对应于在晚期胚胎发育中进入静止状态的Z2/Z3细胞(Schedl 2013)。在S3、S5和S8中,内胚层激活因子SKN-1高度表达。此外,中胚层因子TBX-35在S3中高度表达。因此,可以确定S3对应于主要分裂产生中胚层的MS细胞。内胚层因子END-3在S3和S8中都高度表达。考虑到稳态之间的转换路径,只有S5可以直接从S1(代表P系)通过单个过渡状态转换而来。因此,S5被识别为EMS细胞,S8被识别为发育成肠道的E细胞。PAL-1在S2和S6中都高度表达,表明这些状态对应于在P2子代细胞中产生体细胞的C和D细胞。由于D细胞专门分化为肌肉(Gilbert和Barresi 2016),S6以其高HLH-1表达被识别为D细胞,而S2被识别为C细胞。在S7、S9和S10中,前部因子PAR-6和PLK-1高度表达,而在P1中不对称分布的母体转录因子SKN-1、PIE-1和PAL-1的表达水平较低,表明这些状态对应于AB系。内胚层因子TBX-37在S7中高度表达,Notch配体GLP-1在S9中高度表达,导致S7被识别为ABa,S9被识别为ABp,S10被识别为普通AB细胞。文献中低通量实验的结果,总结在图3a中,与我们计算出的结果一致。


稳态表达谱进一步通过与高通量数据比较得到验证。使用了两个数据集,GSE77944和GSE83523,这些数据集测量了秀丽隐杆线虫胚胎从受精卵的1细胞阶段发育到16细胞和102细胞阶段的单细胞转录组表达。数据被标准化,0代表因子表达水平最低,1代表表达水平最高。建立了0.5的阈值,小于0.5的差异被认为是一致的,等于或大于0.5的差异被认为是不一致的,计算出的稳态与实验数据之间的一致率在第一个数据集中为58%-82%,在第二个数据集中为64%-82%,如图3c和3d所示。需要注意的是,在两个数据集中一致性较低的因子包括SKN-1、PIE-1、PAL-1和GLP-1。这些差异可能产生是因为网络计算代表的是它们活性状态下的蛋白质浓度,而SKN-1、PIE-1和PAL-1是母体转录因子,其调控主要发生在翻译和翻译后修饰水平,导致mRNA表达水平与实际蛋白质浓度之间的差异。GLP-1是位于细胞膜上的受体,其活性浓度不一定与其mRNA表达水平相关。总之,计算出的稳态与实验数据之间的符合率始终在合理范围内,强烈支持这些稳态与秀丽隐杆线虫早期胚胎发育期间观察到的细胞类型相对应。


3. 稳态的拓扑结构

为了表征细胞命运决定的过程,我们进一步对网络施加局部扰动,以研究不同稳态之间的相互连接和过渡路径,如方法部分所详述。汇总所有过渡状态的扰动结果,并与之前获得的稳态进行比较,我们得到了构建的内源性网络的景观拓扑结构,如图4a所示。这里,超过渡状态的顺序对应于雅可比矩阵具有非负实部的特征值的数量。该景观使我们能够解释转录因子在发育过程中的调控作用。它通过克服中间状态的潜在障碍,促进细胞在不同稳态之间的转换,这些中间状态由转录因子塑造。


我们根据稳态之间的连接性将过渡状态分类为不同的集合,并总结了通过这些过渡状态集合出现的稳态之间的转换路径,详见表1。因此,我们能够构建秀丽隐杆线虫早期胚胎发育的景观。这一结果代表了Waddington表观遗传景观的定量实现,包含了10种实验观察到的细胞类型:AB、ABa、ABp、EMS、MS、E、C、D、P和Z,以及这些细胞类型之间可能的转换路径,这些路径由过渡状态连接。构建的景观揭示了早期胚胎发育期间的24条发育路径,其中9条与实验观察现象一致,对应于秀丽隐杆线虫早期胚胎发育初期细胞状态变化的轨迹,如图4c所示。需要注意的是,单个过渡状态可以连接多个稳态,呈现路径之间的交叉点。


4. 细胞命运调控模拟

通过调节网络中特定因子的表达水平,可以模拟不同细胞状态之间的转换。首先,可以模拟细胞间信号通路的效果。在4细胞阶段,P2细胞向AB细胞传递Notch信号,导致与P2接触的AB细胞的子代ABp细胞的膜表面激活受体GLP-1,这种信号抑制ABp细胞的子代细胞发育成中胚层(Priess 2005)。在我们的模型中,稳态S10代表AB细胞。为了模拟P2细胞的信号效应,我们增加了AB细胞表达谱中生殖细胞特异性因子PIE-1的表达。从这个初始状态的演化路径通过过渡状态T33到达代表ABp细胞的稳态S9,与发育期间的现象一致。类似地,P2细胞向EMS子代细胞的Wnt信号促进E细胞的命运(Owraghi等人 2010)。通过增加代表EMS细胞的稳态S5中PIE-1的表达,演化路径通过过渡状态T31进入代表E细胞的稳态S8。这些结果如图5a所示,与观察到的发育过程一致,进一步验证了核心内源性网络模型。

我们进一步探索了AB细胞附近的在正常发育中不发生的转换路径。在代表AB细胞的稳态S10中过表达SKN-1,将系统通过过渡状态T20转移到代表EMS细胞的稳态S5。当SKN-1和POP-1都被过表达时,它通过超过渡状态T23转移到代表MS细胞的稳态S3。类似地,在S10中过表达PAL-1导致其通过过渡状态T26转换到代表D细胞的稳态S6。当PAL-1和LIN-26都被过表达时,S10通过超过渡状态T14转变为代表C细胞的稳态S2,如图5b所示。这些发现预测了诱导AB细胞转换到替代系谱的潜在调控策略。它们将在下文中进一步讨论。


讨论


秀丽隐杆线虫的早期胚胎发育已经被广泛研究,提供了丰富的实验数据,为进一步分析提供了理想的平台。基于对文献的广泛搜索,我们选择了17个核心因子,以及它们的促进或抑制相互作用,构建了秀丽隐杆线虫早期胚胎发育的核心内源性网络。网络的演化动态自然产生了不同的细胞命运和各种中间状态。在合子的初始分裂中,每次不对称分裂都会产生一个可以产生体细胞后代的祖细胞和一个干细胞(P1-P4细胞)(Schedl 2013; Gilbert和Barresi 2016)。在本研究中,我们将P1-P4细胞归类为我们模型中的同一稳态S1。从网络动态的角度来看,P1-P4细胞在同一细胞状态下自我更新,它们产生分化为不同稳态的祖细胞。连接这些稳态的转换路径反映了细胞的发育景观。在图4中,代表生殖细胞Z2/Z3的稳态不能通过单一过渡状态转换到体细胞发育路径,这与胚胎发育中体细胞和生殖细胞系的分离一致(Seydoux和Fire 1994)。


由内源性网络生成的景观内的路径是双向的。例如,P细胞和体细胞之间的转换路径既可以代表P细胞通过过渡状态分化为体细胞,也可以代表后者通过同一过渡状态逆转回生殖细胞干细胞,这表明体细胞有可能去分化。除了在正常胚胎发育期间观察到的路径之外,景观还揭示了额外的转换路径,如图4b中的灰色线所示。其中涉及AB系的转换最为广泛,对应于AB系女儿细胞在神经系统、咽部、皮肤、体壁肌肉等中的广泛分布。这些路径具有显著的分化潜力(Sulston等人 1983)。此外,这些稳定状态之间的多条路径的存在反映了发育中的冗余和鲁棒性。也就是说,即使在调控变化或基因突变之后,也可以产生相同的细胞类型(Maduro等人 2005; Fukushige等人 2006)。看来,细胞命运决策的结果更多地依赖于基因组蓝图,而不是特定的发育过程。


通过定量调控一些目标因子,可以模拟细胞间信号如何影响细胞状态,导致AB细胞通过非典型途径发生转分化。随着这些转换过程中核心内源因子的时序动态变化,为诱导调控细胞状态提供了理论基础。这类研究在发育生物学中极为重要,例如可以研究细胞如何在特定环境中通过精细的信号调控实现特定的命运决策。它可能识别出与疾病相关的关键因子,提供精确干预和药物治疗的潜在靶点(Zhang et al.2024),从而在更广泛的视角下推进精准医学领域。基于核心内源网络,所获得的拓扑景观成功地描述了秀丽隐杆线虫的早期胚胎发育。然而,目前对最初几次分裂中涉及的模块和因子的关注限制了我们对后期阶段的探索,将研究范围限制在每个系谱的早期祖细胞阶段。随着凋亡和其他关键模块的加入,研究可以扩展到胚层形成阶段及以后每个系谱的发育过程。这可以涵盖整个发育过程中负责产生多样的细胞类型、组织和器官的动态机制。


结论

为了从系统生物学的角度探索发育进程背后的机制,我们分析了模式生物秀丽隐杆线虫在其早期胚胎发育的内源性网络平台上的表现。通过在因果动态框架内封装基因组水平的相互作用和细胞水平的表型数据,我们能够恢复所有观察到的分化过程,并提出进一步的预测,等待实验验证。随着当前的成功,类似的研究也可以在更复杂的生物体中进行。这项工作展示了本研究中采用的理论基础的高适用性。







https://www.biorxiv.org/content/10.1101/2024.10.25.620330v1.full.pdf


CreateAMind
ALLinCreateAMind.AGI.top , 前沿AGI技术探索,论文跟进,复现验证,落地实验。 鼓励新思想的探讨及验证等。 探索比大模型更优的智能模型。
 最新文章