导 读
吴家睿1,2
(1 上海交通大学安泰经济与管理学院/主动健康战略与发展研究院,上海 200030;2 中国科学院上海高等研究院国家蛋白质科学研究 (上海)设施,上海 201210)
宇宙学的研究发现,宇宙的各项基本物理特性对生命之存在恰到好处,如果这些物理特性发生一点点的变化,生命可能就不会形成。例如,原子里的中子与质子的质量比为1.0014,如果这个比值相反,那么宇宙中的所有质子都会在大爆炸后不久就衰变为中子,原子将不复存在。又例如,作为碳基生命的碳元素源于恒星内部的核聚变;研究者指出,在这种核聚变过程中,由氦到碳的高效合成取决于原子内的强核力与电磁力之间微妙的平衡,如果强核力再强一点点或再弱一点点,碳的合成就成为问题。不仅宇宙在大尺度时空范围提供了对生命友好的条件,而且太阳系的特点也为生命在地球上的产生与进化提供了基本的保障。太阳作为给生命提供能量的恒星,其质量大小正好可以满足对地球进行稳定并适中的辐射;此外,太阳系是单恒星系统,使得地球能够在一个接近圆的轨道上长期稳定地运行。更重要的是,太阳系位于离银河系中心2.64 万光年的边远地带,邻近它的恒星数目比较少,从而使得太阳系的寿命足够长,能够为地球上长达40亿年的生命演化提供充分而稳定的时间。
虽然萨根博士看到了人类在宇宙中的孤独,但是他仍然乐观地相信其他行星上有可能存在着类似于人类的复杂生命。美国康奈尔大学专门为萨根博士成立了“暗淡蓝点研究所”,致力于寻找宇宙其他星球上可能存在的生命,尤其是智慧生命。但是,许多科学家并不这样乐观,他们认为像人类这样的复杂生命在宇宙中极为稀有;例如,英国科学家尼可· 莱恩(Nick Lane) 在《复杂生命的起源》一书中就明确写道:“通往复杂生命之路,在演化历史上并不是注定出现或者普遍存在的。宇宙并没有承诺我们的存在。复杂生命有可能出现在其他星球上,但不太可能是普遍现象;基于同样的原因,它在地球上也没有重复发生过”[1]。
1859 年,英国生物学家查尔斯·达尔文(Charles R Darwin) 发表了《物种起源》一书,为地球的生命演化给出了一个科学的解释,即人们现在所熟知的“自然选择”—— 生物体内部产生的变异影响其对外部环境的适应,进而导致“适者生存”。但这里要强调的是,达尔文进化论的核心观点其实在于:地球上的各种生物之间有着广泛的联系,即使是人类也不例外—— 复杂生命来自于简单生命。达尔文在《人类的由来》一书中明确提出,人类起源于猿猴;他特别指出:“我认为我们必须承认,即使是具备了所有高贵品质的人……在他的身体中仍然烙着他卑微出身的印记”[2]。虽然达尔文当时对生命的遗传规律不甚清楚,也没能揭示出不同物种之间的内在联系究竟是什么,但他那种把地球上所有生命联系起来进行思考和理解的整体论方式对今天的研究者仍然具有重要的指导意义。随着20 世纪中叶分子生物学的诞生,尤其是21 世纪之初“人类基因组计划”的实施,研究者对生命的认识取得了巨大的进展。显然,我们有必要利用生命科学的最新知识和前沿成果,再次从整体论的角度深入地分析一下地球上的生物世界。
1 生命世界实现统一的底层逻辑:遗传语言
生物体之生命力的体现,就在于生物体在繁衍过程中能够把自身的各种特征信息一代又一代地遗传下去。美国科学家詹姆斯· 沃森(James Watson)和英国科学家弗朗西斯· 克里克(Francis Crick) 于1953 年提出了DNA 双螺旋模型,从分子层面为生物体是如何保存和传递遗传信息给出了明确的解释:DNA 双螺旋是由两条长长的多核苷酸链缠绕形成的,其中每条多核苷酸链是由4 种称为“碱基”的化学小分子( 其英文首写字母分别是A、T、G、C)作为基本“砖块”相互连接而成;正是这4 种碱基之间特定的排列顺序记录了生物体的遗传信息;而不同种类的生物体具有不同碱基序列的DNA 双螺旋。
可以说,大自然在创造生命时采用了“写书”的方式,利用DNA 双螺旋上的碱基作为“文字”,通过特定的“语法”创作出了自然界无数种类的“生命之书”。大自然首先利用4 种碱基A、T、G、C作为创作“生命之书”的4 个“字母”,然后把其中每3 个碱基组成一个类似“单词”的遗传密码子(genetic codes),由此形成了64 个遗传密码“单词”。通常在DNA 双螺旋上由多种遗传密码子连接起来的一段碱基序列称为一个“基因”(gene),它就如同一个由许多“单词”组成的“句子”,用来确定一种蛋白质的氨基酸种类及彼此间的次序。生物体正是把这套“文字”和“语法”作为生命活动的“底层逻辑”。
地球上的生命在40 亿年左右的时间进程中,从简单生命逐渐演化出了复杂生命;简单生命与复杂生命的重要区别之一就是,前者拥有的碱基数要远少于后者,如大肠杆菌只有470 万个碱基对(base-pair, bp),而人类则拥有30 亿个碱基对。更重要的是,不同物种拥有各自特定的碱基序列,通过这些碱基序列编码各自的生物学性状。例如,人类大脑皮质的体积大于其他种类的哺乳动物;研究者把人类特有的一个基因转入小鼠胚胎,就能够使小鼠大脑皮质的体积增大[3]。
生命的遗传语言体系从进化的角度来看,必须要考虑到两个方面的需求:高保真性与可变异性。首先是要能够在繁衍过程中把亲代的遗传信息准确无误地传递给子代,从而保持生物体性状在代际间之稳定。DNA 双螺旋结构正是保证遗传信息准确传递的物质基础:一条多核苷酸链上的碱基按照“碱基配对”的规则与对应的多核苷酸链上相应的碱基形成氢键,即A 与T 配对、G 与C 配对。在生命繁衍过程中,亲代生物体首先要把其DNA 双螺旋的两条多核苷酸链解开,形成两条“模板”链,进而根据“模板”链上的碱基序列依照“碱基配对”的规则分别合成两条新链,如同复印文件一样产生两个与亲代碱基序列一样的DNA双螺旋。这个过程被称为DNA复制(DNA replication)。
然而,如果生物体只是考虑而仅仅保证遗传活动中信息的高保真性,那就谈不上生命的进化,尤其是要从简单生命发展到复杂生命。换句话说,如果生物体的碱基序列不能够产生任何变异,那么地球上的生命形态到今天为止可能仍然只会是一些类似于大肠杆菌那样非常简单的微生物。显然,生命的演化需要遗传语言具有可变异性。研究者发现,生命体内的遗传物质存在着多种多样的变异,包括在DNA 复制过程中两条多核苷酸链上碱基的错误配对、生殖细胞形成时碱基片段之重组,以及外部环境诱导的碱基变异等。这些遗传变异导致了个体之间存在着各种各样的差异,如德国哲学家莱布尼茨所说:“世上找不出两片完全相同的树叶”。尽管达尔文当时并不清楚遗传变异是如何产生的,但在他的进化理论中,仍然明确地把个体的遗传变异视为进化的基本原材料:“此等变异为自然选择提供了材料,……如果没有这种变异发生,自然选择就不能发生作用”[4]。达尔文的科学假设已经得到了当今众多研究工作的支持,如Science 杂志2017 年发表的一篇论文就指出,细胞的DNA 在每一次复制过程中都会随机地产生若干碱基突变[5]。
从以上讨论可以看到现代生命科学的一个重要“公理”,即存在于地球上的一切生命,包括那些早已消失且深埋在地层里的生命,以及那些藏在深海里或高山上无人知晓的生命,都采用了同一套遗传语言—— 利用碱基作为“字母”来记录机体的遗传信息,并遵照碱基配对和遗传密码等“语法”规则来传递机体的遗传信息并予以利用。因此,地球上生命世界实现统一的基础就在于所有生物体都在“讲”同一种遗传语言。更重要的是,生命世界在遗传语言高保真性与可变异性之间的相互作用下不断地涌现出千千万万种生命新类型,让生命一步一步地从简单走向复杂,在时间尺度上也实现了生命世界的统一性。如果把遗传语言体系比喻为生命的“语系”,那么不同门类的生物体之基本差别就在于,他们属于生命“语系”里的不同“语族”;而同一门类里不同物种则拥有各自特定的“语种”。
2 穿越时间的生命“超链接”:生命之树
这个刻画了生命世界统一性的“公理”源于达尔文提出的“生命之树”。达尔文明确指出,从生命演化史来看,不同物种之间存在着某种亲缘关系;而且不论这些物种现在亲缘关系之远近,他们都源自同一株“树”:“同一纲中一切生物的亲缘关系常常用一株大树来表示” [4]。他在《物种起源》一书里提供了一幅树形图,用来描绘生命不同种类之间的亲缘关系—— 在这棵生命之树上,树干的底部代表着原始的生物类型,沿着树干向上长出了许许多多的分枝,象征着由原始的生物类型演化而成的各种生物类型。他在该书的最后一章写到:“我们必须同样地承认曾经在地球上生活过的一切生物都是从某一原始类型传下来的”[4]。
可以这样认为,达尔文进化论的基础就是这棵生命之树,它将看似杂乱无章的生命世界整理得次序井然;无论是微小的细菌还是苍天大树,无论是简单的爬虫还是智慧的人类,都被归结到这棵“树”的某一位置。我们首先可以看到,生命世界的复杂性随着生命之树的生长而增加,这棵“树”的最下端是简单的单细胞原核生物,包括了真细菌(Eubacteria)和古细菌(Archaebacteria) 两大类型;它们都是从更为原始的生物类型演化出来的。这棵“树”的中段是各种单细胞真核生物(single-cell eukaryotes),如酵母或阿米巴虫,其内部空间高度分化而形成了细胞核与线粒体等各种细胞器。这棵“树”的上端则出现了更为复杂的多细胞真核生物(multicellular eukaryotes),包括了各种动植物乃至人类。更重要的是,各种生物体之间的分类位置和演化关系可以从生命之树的分枝结构得到直观的体现:其主干分枝之上长出了若干分枝,这些分枝还可以继续分下去,正如达尔文所形容的那样:“绿色的、生芽的小枝可以代表现存的物种;数年前生长出来的枝条可以代表长期连续的绝灭物种”[4]。也就是说,生命之树通过其分枝结构把各种生物体进行了系统的分类,相当于生物学“阶元系统”——界、门、纲、目、科、属、种;如现代人类属于动物界,脊索动物门,哺乳纲,灵长目,人科,人属,智人种。显然,生命之树正是反映了生命世界系统分类和演化关系的“系统进化树”。
生命之树的存在与生长同样离不开遗传语言,从最为简单的远古原始生物类型到当今形态万千的复杂生物种类,把它们维系在一起的依然是生命世界特有的碱基“文字”和相关的“语法”规则。早期的研究者缺乏遗传语言方面的知识以及相关的研究技术,只能依靠生物体的表型特征进行系统分类和演化关系的研究,构建的生命之树不够完备或不够准确。随着人类基因组计划的实施和相关DNA测序技术的发展,今天的研究者已经能够重构更为合理的生命之树了。
2024 年5 月,Nature 杂志发表了一篇鸟类系统进化树重构的文章,研究者总共比较了鸟类分类系统中218 个科包含的363 个种(占现存所有鸟类
的92%) 之基因组碱基序列的异同,建立了一套新的鸟类分类方案,并改变了过去对鸟类演化历史的认识[6]。Nature 杂志此后发表的另外一篇研究论文则报道了研究者对被子植物系统进化树的构建[7]。被子植物位于植物界进化阶梯的顶端,种类最多,共有64 目416 科;一个多世纪以来,构建被子植物的“系统进化树”一直是进化生物学领域的一个重要目标。在这篇论文中,研究者对占其总数58%的9 506 种植物材料进行了353 个基因的测序和比对,基于这些碱基序列数据构建了被子植物的“系统进化树”[7]。值得指出的是,这些用于基因测序的材料来自48 个国家163 个植物标本馆的植物标本,其中有些标本已经有200 多年的历史了[7]。
过去在灵长类演化研究领域基因组测序工作进展缓慢,使得人们对非人类灵长类动物的进化关系并不清楚,为此国际科学界启动了“灵长类基因组
计划”。2023 年6 月,Science 杂志发表了该计划的8 篇论文,涉及到230 多个灵长类物种的全基因组测序。在该专辑的一篇论文中,中国科学家通过对涉及到38 个属和14 个科的50 个灵长类物种的分析提出,所有灵长类动物的最近共同祖先出现在大约6 829 万到6 495 万年前,大致临近白垩纪与古近纪交界时间;由此可以推断,灵长类生物的起源可能与导致恐龙灭绝的白垩纪末期大灭绝事件相关[8]。
构建生命之树的遗传语言中有一条基本的“语法”规则:承载信息的遗传物质是由亲代生物体传递给子代个体。显然,这种把携带生物体性状的遗
传信息通过遗传物质一代又一代传递下去的方式可以被称为“垂直传递”。正因为有了“垂直传递”的遗传机制做保证,这才有了生命之树,也才有了在这棵“树”众多枝头上生长出来的各类“物种”(species)—— 生物分类系统中的基本单元,并让演化过程中产生的不同生命种类之间形成了穿越时间的“超链接”。我们知道,达尔文进化论的核心问题是“物种起源”。现在普遍认为,物种形成的标志是生殖隔离,即物种内的遗传物质不能在物种之外进行传递,如马和驴是两个物种,二者杂交产生的骡子是不能繁衍后代的。正是物种内的生物个体采用了“垂直传递”的遗传机制,从而保证了物种之间的生殖隔离。
生殖隔离的主要功能是为物种提供一个遗传信息的“防火墙”,以保证物种内个体之间遗传语言的高保真性,进而保证物种内个体之间性状的稳定性。不久前,研究者对分布在全球范围的一种名为“拟南芥”的植物进行了基因组碱基序列和染色体结构的分析,研究结果表明,虽然用于研究的69个拟南芥材料采集于地球的不同区域,包括从非洲中部到冰岛,从北美到日本,但这些拟南芥植株的基因组结构表现出了高度的保守性;而且有60%的基因种类存在于所有69 个拟南芥植株的基因组内[9]。也就是说,只要是同属于拟南芥这个物种的植株,不论它们长在地球的什么位置,处于什么环境之下,其采用的遗传语言基本上是一样的,属于同一个“语种”。
然而,在生命之树的生长过程中,不仅要利用遗传语言的高保真性为物种之形成提供“防火墙”,而且需要通过遗传语言的可变异性为物种之演化提
供“原材料”。在地球出现原始生命形态之后漫漫40 亿年的时间里,生命之树通过其遗传语言的高保真性和可变异性之间复杂的相互作用,生长出了“枝叶茂盛”的生命种类—— 根据研究者的粗略估计,地球现存的物种有3 000 万种左右,人们已知的大约是其中的10%。显然,一旦把握了生命之树的遗传语言高保真性和可变异性之间的关系,将从根本上揭示物种的演化规律,并明白人何以为人。为此,一项国际研究计划“Zoonomia Project”于2006 年启动,其研究任务是开展包括人类在内的数百种哺乳动物的基因组测序,进而通过这些基因组碱基序列的分析来探讨哺乳动物的演化规律。
Science 杂志在2023 年4 月发表了该研究计划的首个专辑,其中包括了11 篇研究论文,涉及到240 种有胎盘哺乳动物的全基因组测序和分析。在一篇论文中,研究者通过碱基序列的比对,发现了4 500 多个长度至少为20 个碱基的超级保守片段,这些碱基序列在这240 种有胎盘哺乳动物的98%中基本上不发生改变;此外,在人类基因组中,至少有10.7% 的碱基片段在进化过程中是高度保守的[10]。这种碱基序列的高度保守性通常源于演化中的选择压力,被称为“进化约束”(evolutionary constraint) ;研究者通过“进化约束”的算法,比较了这240 种哺乳动物在1 亿年左右演化时间里其基因组中单个碱基对的变化情况,确定出人类基因组中有3.3% 的碱基对是明显受到进化约束的[11]。研究者另一方面则发现,这些哺乳动物基因组内还存在许多变异频繁、快速演化的碱基序列,它们往往涉及免疫应答等动物与环境密切互动的功能,如人类基因组内存在一些特定的碱基序列,被称为“人类加速区”(human accelerated regions),这些特定的功能片段不存在于其他哺乳动物的基因组序列之中,其功能是调控与人类大脑发育相关的基因活动[12]。该专辑的编者认为:“Zoonomia 计划预示着一个新时代的到来,即对数百个物种的基因组进行的联合测序和比较研究将打开一扇大门,进而可以从全新的思路来理解哺乳动物、哺乳动物进化以及人类自身”[13]。
3 跨越空间的生命“超链接”:生命之网
“垂直传递”方式确保了遗传语言在生物个体中一代又一代的传承,不仅让子代继承了那些来自先祖的基本“词汇”,而且把演化过程中个体产生的变异“新词”也传递下去,正如达尔文所说:“我们有理由可以相信曾经遗传过许多世代的变异可以继续遗传于几乎无限数目的世代” [4]。重要的是,生命之树的“垂直传递”方式规定了遗传物质沿着时间轴流动的“单向车道”,只能是那些“同门同宗”的个体才能获得亲代的遗传物质并能够传递给下一代,而分类系统里那些“空间”距离彼此较远的个体之间就很难进行遗传物质的交流。这就好比在生命之树的树干上相互连接的分枝长出的生物种类保持着一种遗传语言的交流连续性,即享有同一个最近的共同祖先;而从不同树岔的分枝之上长出的生物种类则存在着较远的分类关系,彼此的遗传语言存在着明显的间断性。换句话说,生命之树所采用的遗传物质“垂直传递”方式防止了跨物种的“横向”遗传信息交流,尤其阻止了那些位于不同“属”或不同“科”等分类位置之生物种类的远缘杂交,从而在其漫长的演化进程中保证了生命之树上形成的分类“等级”系统以及不同生物种类之间亲缘关系的有序性递呈。
但是,生命世界作为一个开放的复杂体系,它的运行并非就仅仅依靠这一简单的规则,其体系内部各种生物种类之间的复杂相互作用导致了生命世界存在着诸多的不确定性和不可预测性,这才是生命世界存在并适应地球环境千变万化的本质特征。美国著名古生物学家、进化生物学家斯蒂芬· 古尔德(Stephan Gould) 曾经这样说过:“如果我们将生命史的磁带‘倒带’并重新播放,所进化出来物种、身体构造和表型可能会完全不同”。随着人类基因组计划的完成以及数万种生物种类全基因组碱基序列测序的完成,研究者可以在分子层面直接通过对不同物种之间的基因组碱基序列之比较,重新认识遗传语言在生命世界的流动情况。研究者发现,生命世界里还广泛存在着分类距离很远的生物种类之间的“横向”遗传信息交流方式,称为“基因平行转移”(horizontal gene transfer, HGT) ;它打破了亲缘关系的限制,使生物体之间基因流动变得更为复杂。
一般而言,病毒在侵袭宿主细胞的过程中很容易发生HGT ;病毒和真核生物之间通过HGT 进行基因交换是一个关键的进化驱动因素。不久前的一
项研究工作系统地评估了201 个具有代表性的真核生物基因组和10 万多个的病毒基因组之间的HGT模式,发现了数千个基因转移活动,其中真核生物基因转移到病毒基因组的频率大约是病毒基因转移到真核生物基因组的两倍[14]。此外,人类基因组中有8% 左右的碱基序列源于一类古老病毒ERV(endogenous retrovirus) 对宿主的侵染,即在人类演化过程中,大量ERV 碱基序列通过HGT 进入人类基因组并被整合成为宿主基因组的组分。最近有研究发现,ERV 元件在正常生理条件下处于沉默状态,但在衰老过程中被激活而触发炎症,并进一步诱导更多的细胞进入衰老状态[15]。
研究者通过对40 种动物基因组碱基序列的比较,发现HGT 现象广泛存在于动物体内,在每种动物的基因组内通常都有几十甚至数百个“外来基
因”,其中人类基因组就有33 个通过HGT 获得的外来基因 [16]。水熊虫(tardigrade) 属于微型缓步类爬行动物;它不仅是地球上生命力最强的生物,而且它的基因组也可能是HGT 程度最高的—— 其基因组内水平转移基因的比例高达17.5%,这些基因分别来自1 361 种细菌、40 种轮虫、91 种真菌、45种植物和6 种病毒[17]。中国科学家于2024 年10 月在Science 杂志上报道了一种新发现的水熊虫及其多组学研究,结果发现其基因组拥有75 个高可信的HTG 基因,这些外来基因对这类水熊虫的抗辐射能力起着重要的作用[18]。
植物界中同样广泛存在着HGT。例如,研究者通过对四个植物类群( 绿藻、苔藓、蕨类、种子植物) 的12 个代表性物种的全基因组序列分析,共发现了来自细菌、病毒、真菌或动物的593 个“外来”基因;它们主要是通过细菌和真菌等微生物传播的。这项研究还发现,陆生植物的演化过程中存在两个主要的HGT 阶段,在这两个阶段共有超过100 个基因片段从微生物进入植物;这些从微生物基因组获得的基因影响了植物的生理和发育,帮助植物更好地适应环境,进而有利于它们生活在陆地上;这意味着植物从水中到陆地的进化可能是由HGT 所驱动[19]。有趣的是,动物与植物之间也有基因交换。不久前的一项研究发现,烟粉虱(whitefly) 作为世界第二大植物害虫,其危害能力来自HGT :即烟粉虱通过HGT 获得了植物基因组里的一个“解毒基因”,从而让烟粉虱产生了独特的寄主适应性,在侵袭植物时巧妙利用这个从植物偷来的“解毒基因”,能够像宿主植物一样降解来自植物体内的有毒代谢产物“酚糖” [20]。
需要指出的是,达尔文进化论提出的垂直遗传机制针对的是采用有性繁殖的生物类群,没有涉及生命世界里采用无性繁殖的另外一类生物,如原核生物或单细胞真核生物。研究者在20 世纪中叶发现,细菌等各种原核生物大多拥有一类在染色体之外的微小环状DNA 分子,它们通常携带着若干个基因,被称为“质粒”(plasmid)。可以这样说,质粒正是细菌等无性繁殖的生物类群之间实现HGT 常用的遗传信息交流媒介。不同类型的细菌之间可以通过交换质粒来影响或改变其性状,如耐药菌所携带的质粒往往具有特定的耐药基因,这类质粒通过HGT进入没有耐药性的细菌,使其获得耐药性。不久前,一项研究系统地分析了细菌群体里1 万种质粒的基因组序列,发现它们通过HGT 在整个细菌家族里形成了一个庞大的细菌遗传交流网络[21]。
人们进一步发现,质粒不仅广泛存在于细菌,而且也存在于古细菌和真核细胞中。在人类基因组中存在着200 多个与细菌基因高度相似的基因序列,它们有可能就是从细菌的质粒通过HGT 转移到人类基因组的。2024 年Cell 杂志发表的一项研究发现,人类肠道中最丰富的染色体外遗传元件是一种叫做pBI143 的质粒,且其拷贝数在炎症性肠病等肠道环境免疫系统失调的情况下明显增加[22]。虽然尚没有发现这种质粒能够进入人体细胞,但该研究依然是一个表明质粒在细菌和人体之间进行HGT的佐证。
HGT 以及跨物种远缘杂交等非垂直遗传机制的广泛存在清楚地表明,生命世界并非是一棵遗传信息只能沿着一个方向流动的“生命之树”,而是一个遗传信息交织互联的“生命之网”。这个生命之网提升了生命世界的复杂性,让亲缘关系远离的生物类群能够分享彼此的遗传元件,进而在遗传语言上形成了错综复杂的非线性关系。这个生命之网提升了生命世界的可变性,让众多物种的变异程度超过了物种自身碱基序列随机突变或重组的范围,进而使得生物体涌现出众多全新的表型或性状。这个生命之网提升了生命世界对环境的适应性,让生物体在面对复杂多变的环境时有了更多的“武器”,进而导致生命渡过了各种外部环境之考验并不断地拓展其生存空间。
4 生命世界:一个全时空链接的生命“互联网”
如果说生命之树把地球上存在过的生命联系起来,那么生命之网则将地球上处于不同生存形态的生命联系起来了。生命之树表明生命世界是一个绵延不息的整体,无论是现存的还是逝去的生物体,都有着或远或近的亲缘关系;生命之网则表明生命世界是统一在遗传语言的架构之上,无论是原核的还是真核的生物,都能够交换彼此的遗传信息。生命之树把地球上林林总总的生命种类整理成为次序井然的“家谱”,让它们“ 万变不离其宗”;生命之网则把千差万别的生物体通过遗传语言进行了“超链接”,让它们“你中有我,我中有你”。
需要指出的是,这种全时空链接的生命“互联网”是生命科学能够实施的必要条件。由于生命科学实验条件的有限性,研究者一般只是采用某一种生物材料来进行实验,但其研究成果通常都会外推至不同的物种,如建立DNA 双螺旋模型的关键数据——DNA 的X 射线衍射图—— 来自小牛胸腺的DNA 样品,但该模型被外推至地球上所有的生物种类,因为研究者相信这样一个“公理”。这个“公理”对研究人类自身尤其重要,因为有伦理的限制,人类的基因和蛋白质通常都是采用各种模式生物如酵母、线虫、果蝇、老鼠等来进行研究。更重要的是,这个“公理”是研究者改造和利用生命的基石:一个基因可以在不同种类的生物体里发挥同样的功能,如研究者将比目鱼的抗冻蛋白基因转移到西红柿里,使得西红柿也产生了这种抗冻蛋白而成为了抗冻西红柿。显然,事关人类健康的临床研究之底层逻辑正是这一生命的普适性“公理”。
大自然在地球生命诞生之际设计了遗传语言作为生命的底层逻辑。遗传语言承载和表达了遗传信息,而遗传信息则充分展现了信息的两个本质特征:不确定性和开放性。正是遗传语言的这两个特征深刻地影响了生命的行为方式,使得生物体从诞生之初就具备了强大的生命力,能够适应地球变幻莫测的环境,并在适应的过程中一步步地迈向复杂体系,进而演化出千千万万种生命类型乃至人类,让地球拥有了一个全时空链接的生命“互联网”。
收稿日期:2024-11-28
基金项目:深圳市医学研究专项资金“基于主动健康的糖尿病全过程整合研究”(C2406002)
通信作者:wujr@sibs.ac.cn
[参考文献]
[1] 尼可·莱恩. 复杂生命的起源[M]. 严曦, 译. 贵阳: 贵州大学出版社, 2020
[2] 达尔文. 人类的由来[M]. 潘光旦, 胡寿文, 译. 北京: 商务印书馆, 2009
[3] Tomasetti C, Li L, Vogelstein B. Stem cell divisions, somatic muations, cancer etiology, and cancer prevention. Science, 2017, 355: 1330-4
[4] 达尔文. 物种起源[M]. 周建人, 叶笃庄. 方宗熙, 译. 北京: 商务印书馆, 1981
[5] Florio M, Albert M, Tavern E, et al. Human-specific gene ARHGAP11B promotes basal progenitor amplification and neocortex expansion. Science, 2015, 347: 1465-70
[6] StillerJ, Feng S, Chowdhury A, et al. Complexity of avian evolution revealed by family-level genomes. Nature, 2024, 629: 851-60
[7] Zuntini R, Carruthers T, Maurin O, et al. Phylogenomics and the rise of the angiosperms. Nature, 2024, 629: 843-50
[8] Shao Y, Zhou L, Li F, et al. Phylogenomic analyses provide insights into primate evolution. Science, 2023,380: 913-24
[9] Lian Q, Huettel B, Walkemeier B, et al. A pan-genome of 69 Arabidopsis thaliana accessions reveals a conserved genome structure throughout the global species range. Nat Genet, 2024, 56: 982-91
[10] Christmas MJ, Kaplow IM, Genereux DP, et al. Evolutionary constraint and innovation across hundreds of placental mammals. Science, 2023, 380: eabn3943
[11] Sullivan PF, Meadows JRS, Gazal S, et al. Leveraging base-pair mammalian constraint to understand genetic variation and human disease. Science, 2023, 380: eabn2937
[12] Keough KC, Whalen S, Inoue F, et al. Three-dimensional genome rewiring in loci with human accelerated regions. Science, 2023, 380: eabm1696
[13] Vignieri S. Zoonomia. Science, 2023, 380: 356
[14] Irwin NAT, Pittis AA, Richards TA, Keeling PJ. Systematic evaluation of horizontal gene transfer between eukaryotes and viruses. Nat Microbiol, 2022, 7: 326-36
[15] Liu X, Liu Z, Wu Z, et al. Resurrection of endogenous retroviruses during aging reinforces senescence. Cell, 2023, 186: 287-304
[16] Crisp A, Boschetti C, Perry M, et al. Expression of multiple horizontally acquired genes is a hallmark of both vertebrate and invertebrate genomes. Genome Biol, 2015, 16: 50
[17] Boothbya TC, Tenlena JR, Smith FW, et al. Evidence for extensive horizontal gene transfer from the draft genome of a tardigrade. Proc Natl Acad Sci U S A, 2015, 112: 15976-81
[18] Li L, Ge Z, Liu S, et al. Multi-omics landscape and molecular basis of radiation tolerance in a tardigrade. Science, 2024, 386: eadl0799
[19] Ma J, Wang S, Zhu X, et al. Major episodes of horizontal gene transfer drove the evolution of land plants. Mol Plant, 2022, 15: 857-71
[20] Xia J, Guo Z, Yang Z, et al. Whitefly hijacks a plant detoxification gene that neutralizes plant toxins. Cell, 2021, 184: 1693-705
[21] Redondo-Salvo S, Fernández-López R, Ruiz R, et al. Pathways for horizontal gene transfer in bacteria revealed by a global map of their plasmids. Nat Commun, 2020, 11: 3602
[22] Fogarty EC, Schechter MS, Lolans K, et al. A cryptic plasmid is among the most numerous genetic elements in the human gut. Cell, 2024, 187: 1206-22
《生命科学》是由中国科学院上海营养与健康研究所主办,国家自然科学基金委员会生命科学部和中国科学院生命科学和医学学部共同指导的综合性学术期刊。1988年创刊,原刊名为《生物学信息》内部发行;1992年起更名为《生命科学》,公开发行CN31-1600/Q,大16开,96页。本刊是“中文核心期刊” “中国科技核心期刊” “中国科学引文数据库来源期刊(CSCD)”。