导 读
自20 世纪中叶以来,生命科学研究逐渐从单一的生物个体水平延伸到细胞、分子、基因等不同层次。面对生物体的复杂性和多样性,跨层级、多维度、全周期的生命结构与功能研究日益受到重视,整合生物学应运而生,旨在揭示生物体内部各种层次之间的相互关系和调控机制,以期深入了解生物体的功能和行为。回顾数十年整合生物学的发展历程,多学科交叉的工具为其提供了有力的支撑,跨层级的功能涌现现象是其研究的关键节点,其理论基础则在于揭示了非线性、不确定性和异质性等复杂科学特征,为生命健康解决方案的赋能提供了基础。2023 年,整合生物学在研究生命系统的涌现现象、健康及生态环境方面取得了突破性进展,加深了我们对生命系统整体知识体系的理解,也促进了对生物体在健康和疾病状态下的生理和病理变化的全面了解。展望未来,整合生物学或将以更为综合的整体视角,深入解析生命系统的复杂性、临界条件的变化、无序与有序状态的转化过程,进而促进人类对于生命本质的更深认知,创新前所未有的技术策略。
张学博1 ,孟 晶2 ,刘 晓1, 朱成姝1 ,江 源1,阮梅花1,熊 燕1,3 ,陈大明1,3*
(1 中国科学院上海生命科学信息中心,中国科学院上海营养与健康研究所,上海 200031;2 同济大学附属第一妇婴保健院,上海 200092;3 中国科学院大学,北京 100049)
生命体系在微观和宏观层面上都表现出极高的复杂性。从分子、细胞、组织、器官、个体到生态系统,每一层次都有其独特的结构和功能;单一层次的研究虽然能够揭示生命体系的部分奥秘,但要全面理解生命的本质和过程,需要跨越层次,进行多层次、多角度的研究。整合生物学(Integrative Biology) 作为一门交叉学科,旨在探究生命系统不同层次的结构与功能,通过综合各个层次的研究成果,深入剖析生命系统的复杂性,并构建全面的理论框架,以阐述生命现象及生命过程。
“整合”不仅体现了不同学科之间的交叉融合,更能深入揭示生命系统的动态性、适应性和互联性。因此,“整合”在生命科学领域的应用不仅拓展了我们对生命系统的认知,更为全面而系统地推动生命科学的发展,为人类健康和可持续发展打下了坚实的基础。本文在简要总结过去几十年生物学发展历程的基础上,对整合生物学的研究现状及新进展进行了梳理,并对其未来发展前景进行展望。
1 发展历程
20 世纪40 年代, 物理学家薛定谔(Erwin Schrödinger) 凭借其独特的洞察力,发表经典著作《生命是什么》(What is life)[1],不仅为分子生物学的发展奠定了基础,“ 生命依赖负熵而生”的观点也为阐述生命活动的有序性提供了新的视角。《生命是什么》发表后不久,阿列克斯• 诺维科夫(Alex Novikoff) 在《科学》(Science) 杂志发表“整合层级与生物学”(The concept of integrative levels and biology)一文[2],探讨了生物学中不同层次之间的整合问题,为整合生物学的发展奠定了坚实的基础。
20 世纪中叶,科学家们揭示了DNA 双螺旋结构,提出了“中心法则”,并总结了“高层级的存在依赖于低层级,而高层级决定低层级的方向”“任何层级的扰动都会对其覆盖的所有层级产生影响”等整合科学规律[3],这些发现和理论为理解生命系统的复杂性提供了更广阔的视野。同时,还将研究拓展至生态系统层级,探讨生物与环境之间的相互作用[4]。
20 世纪70 年代,遗传学家、诺贝尔奖获得者弗朗索瓦• 雅各布(Francois Jacob) 从揭示生命信息如何传递的视角撰写了《生命的逻辑》(Logic of Life) 一书[5]。雅各布指出,生物学研究存在两个截然不同的范式:整合论和还原论。整合论者认为,子系统应当视为更高层次系统的组成部分加以研究,整体并非部分之和;还原论者认为,生物体确实是一个整体,但整体必须通过部分且仅通过部分来解释,以此来消除不确定性。
自20 世纪末以来,科学家逐步认识到从“整合”的视角理解生命现象的重要性,并试图利用“整合”方法来研究其他学科,相关论文在20 世纪90 年代开始陆续发表,例如“整合”与生物多样性[6-7]、“整合”与生理学[8]、“整合”与内分泌学/ 神经生物学[9]、“整合”与生态学和形态学[10]、生物学层级整合[11-12],乃至“整合”与医学[13-16] 等许多研究及相关成果。
人类基因组计划(HGP) 实施后,基因组学、蛋白质组学等各类组学得到快速发展。莱诺伊• 胡德(Leroy Hood) 在正视各层级的生物组分相互作用基础上,提出了系统生物学(System Biology) 的研究路径[17]。系统生物学作为一种整体视角的生物学研究方法,强调整体与部分之间的相互作用,揭示生物体的组织原则、功能调控以及演化过程,这与整合生物学有着诸多的相通之处。
整合生物学与合成生物学的发展也息息相关。如果说系统生物学的研究更侧重于“格物致知”,那么合成生物学的发展则更侧重于“建物致知”[18]。合成生物学的“自下而上”构建路径,可以以从头开始设计和构建生命系统的视角,研究生命系统中各个组成部分的作用和相互关系,深入理解生命系统的整体规律,揭示生命活动的奥秘。当生命系统的稳定性、功能和行为变得更加可预测、可量化时,对生命系统的精确调控和优化也就有了更深的基础。整合生物学和合成生物学的结合将为我们更好地理解和应用生物学提供了新的途径和机会。
同时,要理解跨层级、多维度、全周期的复杂生命系统,离不开复杂性科学的理论体系和研究方法。复杂系统由许多相互作用的组成部分构成,这些组成部分的相互作用具有非线性、不确定性、异质性等特征[19]。生命系统的层次结构、相互作用网络以及动态演化过程,为复杂性科学提供了丰富的研究资源和实践场景;复合性科学为整合生物学提供了新的研究方法和理论框架,使得生物学家们能够更加全面、深入地探究生命奥秘。
由此,从基因组到表型组的生命组学技术、合成生物学的“ 设计- 构建- 测试- 学习 ”(DBTL)工程循环、复杂系统的“聚集→涌现→迭代→适应→更高层级的演进”等路径,以及类器官芯片等工程化装备、单细胞大语言模型等工具,在整合生物学的研究中交汇,驱动着生命科学及整合科学的发展,促进新理论、新知识、新技术、新产品和新解决方案的不断涌现和进步。
2 重点研究方向与重要进展
近年来,生命科学、化学、物理学、数学等学科的深度融合,为整合生物学研究带来了前所未有的突破。在此基础上,信息技术、人工智能、工程技术的融合运用进一步推动了研究的深入发展。这些技术不仅加深了我们对生命系统整体知识体系的理解,还为技术创新和实践应用提供了有力的支持。同时,这些成果和进展不仅丰富了人类对于多种基因与表型的关联、生物信息的传递和调控机制的认知,也促进了细胞、组织、器官等跨层次的结构与功能涌现现象研究的深入,使得整合生物学的整体视野逐渐清晰,研究框架和内容逐渐明确和完善。
2.1 生命系统的涌现现象研究
涌现现象是解锁生命系统结构和功能复杂性与多样性的关键。在不同层级的模块以特定方式交互的基础上,形成高度结构化的层级交互体系[20]。从复杂系统的视角来看,简单的生物分子结构可通过“自下而上”的自组装和自组织涌现出来,但高度复杂的活细胞等系统还需要“自上而下”的因果关系来构建生命信息[21]。近年来,生命系统的涌现现象研究取得了一系列重要进展。
“自上而下”的因果关系具有因果松弛(causal slack) 特点[22],在因果关系中存在一定灵活性和弹性,使得上层因素对下层结果的影响并非严格而直接的单向传递。这种关系协同整个系统实现更好的自适应选择(adaptive selection),以应对不确定性。在生命系统的自适应选择中,更高层级的环境为子系统提供生态位,例如趋同进化[23]、合成微生命系统[24]、神经系统的可塑性[25] 等。自适应选择赋予生命系统在适应环境时的灵活性,包括条件反射、思维训练等[26]。自适应选择的典型例子包括:生命系统根据细胞功能需求涌现出各类结构复杂的蛋白质[27] ;细胞器根据需要涌现出特定功能[28] ;在生物发育过程中,细胞根据整体功能需求分化成各类特定细胞;大脑连接不仅仅是大脑区域间的信号传输,而且是行为和认知通过皮层区域相互作用的结果[29]。
当“自下而上”的自组装,与“自上而下”的自适应过程形成闭环时,因果封闭性(causal closure)便使得功能涌现呈现出“强涌现”的特点[30]。2023年的一些研究成果表明,多物种共存是微生物群落的一种涌现性现象,不仅仅由双物种共存决定,而是由整个微生物群落的相互作用特性决定。研究人员通过对多次稀释和培养后得到的最终稳定群落中的物种进行双物种共培养实验发现,在144 个竞争对中有103 个无法共存,但也有41 对可以在相同条件下稳定共存[31]。在此之前,另有研究团队已经证明,使用类似于热力学中描述气体行为的粗粒化描述方法,只需要知道物种数量和平均种间相互作用强度这两个参数,就能预测微生态群落中出现的不同动力学相和相变,预测复杂微生态系统的行为[32]。同时,有研究发现个体的发育必须具备抵抗内外部有害干扰影响的能力。这种能力被称为稳健性,它能够区分正常变异和疾病之间的差异。一些系统和器官在纠正内部扰动,例如突变的影响方面更具弹性。同样,器官和生物在抵御外部扰动,例如温度变化方面,也存在差异。此外,所有发育系统都必须具备一定的灵活性,以便促进进化变化。为了全面地理解这种灵活性,需要一个统一的框架来实验性地测试和量化跨研究系统的稳健性。在此背景下,波动不对称性的分析可能成为一种有利的方法[33]。这种方法能够帮助我们理解不同系统间的相互作用,并进一步探究这些交互如何影响生物体的进化。
“自下而上”的自组装、“自上而下”的自适应等机制相结合,为利用合成生物学等方法对生命系统进行再设计带来了新路径[34]。同时,这也对生命活动的系统认知带来了许多新见解。例如,在对生命系统中的强涌现和弱涌现现象进行界定之后,2023 年,研究人员首次提出“ 元通量”(metaflux)的概念,即生命系统的特性表现为物质、自由能和熵的耦合通量网络,并通过不可逆的热力学过程加以呈现,这些生物动力学现象被称为“元通量”[35]。再如,对早期人类演化的研究表明,一系列智人相关的适应性特征,如大型线性身体、延长的后肢、复杂的大脑、减小的性别二态性以及增加的食肉行为等,是在不断变化的环境中智人为了更好地适应生存压力而逐步演变和深化的,并非一次性涌现的结果[36]。然而,由于漫长的时间尺度,对其进行重建或观察变得非常困难。microRNAs 与细胞复杂性的演变有关,它们可能为我们提供关于细胞特化的重要信息。内皮细胞在脊椎动物的循环系统中使血管调节达到了一个关键的平衡水平。2023 年,研究人员提出新的假设:内皮细胞特异性的miR-126 可以促进内皮细胞的血管生成,有助于维护血管完整性,并且通过对miR-126 的演化历史进行重建,发现它可能首次出现在脊椎动物和被囊动物的共同祖先中,表明了microRNAs 可能在细胞类型演变中起到先导作用[37]。
2.2 整合生物学与人类健康研究
整合生物学旨在深入理解生命系统的复杂性,建立综合性的理论框架来解释生命现象和生命过程。广义的整合生物学研究涵盖从分子到生态系统的全尺度整合研究,包括生物体如何组织和调控、个体与环境之间如何相互作用、生物进化的机制和过程等。狭义的整合生物学研究则侧重于从分子到个体的生命组织构成关系,以及和生命活动的因果联系,解析层级内、跨层级的相互作用和调控机制。其中,整合生物学与健康的关系是研究的重点。通过对分子、细胞、组织、器官等不同层次的研究,科学家可以全面了解生物体在健康和疾病状态下的生理和病理变化,促进对生理和病理过程的系统性理解,实现精准预防、诊断和治疗。
在整合生物学的视角下,对反映人体健康状况的生物标志物进行系统分析,可以为个性化医疗提供有利支持。通过更准确、高效的技术手段,可以提高医疗质量和水平,为患者提供更好的医疗服务。例如,染色体外环状DNA (extrachromosomal circular DNA, eccDNA) 参与肿瘤发生和发展。然而,eccDNA 在非小细胞肺癌(non-small cell lung cancer, NSCLC) 中的作用和机制尚未阐明。2023 年,研究人员通过高通量eccDNA 测序和生物信息学分析,鉴定出候选eccDNA 编码的PLCG2 具有癌基因的作用,可能成为NSCLC 诊断和预后评估的新生物标记物[38]。通过分析阿尔茨海默病(Alzheimer's disease, AD) 中发生的表观基因组和基因表达变化,研究人员确定了可能成为新药物靶点的细胞途径,提供了迄今为止关于AD 的遗传和分子基础的最详细的图谱[39]。此外,有研究人员通过ATAC-Seq 技术,以单细胞分辨率测量了健康人和AD 患者基因组各个位点的活性,通过将这些数据与单细胞RNA测序数据相结合,成功追踪了AD 相关基因中发生的基因表达和表观基因组的变化[40]。
运动对人体的内稳态产生重大影响,导致许多细胞、组织和器官发生广泛的扰动,这些扰动要么是由运动增加肌肉的代谢活动引起的,要么是对其产生的反应。对此,身体采取了多种综合而且常常是冗余的反应,以减轻运动引起的稳态调控变化。此外,运动会引起多种全身有益的适应性变化,可以抵抗肥胖、2 型糖尿病和心血管疾病的发生。关于运动对骨骼肌和心血管系统的许多有益影响已经被充分证实,2023 年的研究表明,运动时间对骨骼肌时钟的影响及其作为治疗策略具有潜在作用[41],并进一步突出了运动对脂肪组织的改善在影响代谢和全身健康方面的作用。对运动诱导的白色脂肪组织(WAT) 和棕色脂肪组织(BAT) 适应性的研究表明,啮齿类动物的葡萄糖摄取、线粒体活性和内分泌谱发生了改变,同时在啮齿动物中白色脂肪组织出现“棕化”现象[42]。在此,整合生物学研究提供了对参与运动反应的细胞网络的多样性和复杂性更深入的理解[43],也从整合的视角提出一些健康标志物[44]( 图1)。
在疾病相互关系及预防诊治研究方面[45],随着单细胞生物学[46]、空间多组学[47] 等技术的日益集成,越来越多的研究也倾向于采用整合生物学的理念或策略[48],由此带来了糖尿病[49]、肾病[50-51]、炎症与心血管疾病的关系[52]、阿尔茨海默病[53]、乳腺癌[54] 等方面的研究进展。例如,在美国国立卫生研究院(NIH) 的人类微生物组计划(HMP) 实施的两个阶段中,第二阶段的重点就是整合微生物组项目。该项目通过研究微生物组与妊娠、早产、炎症性肠病、影响糖尿病前期患者的压力源的关系,逐步揭示这些条件下宿主与微生物组相互作用的机制[55]。此外,在急性呼吸窘迫综合征(ARDS)、败血症和急性肾损伤等重症医学的临床实践中,大型临床试验中很少有干预措施显示出有效性。研究人员推断这可能源于患者之间的异质性,需要将生物学异质性的知识应用于临床试验设计。2023 年,他们运用具有预测性且实时变化的评估以及将生物标志物作为替代结果,改变试验设计,探索更有效的治疗方案[56]。
2.3 整合生物学与生态环境研究
在生态环境的认识上,整合生物学强调从整体的角度去审视生态系统。这种整体视角有助于我们更好地理解生态系统的稳定性、生物多样性以及物种间的相互作用,也意味着研究人员可以通过整合微生物群落等构建资源转化技术,探索生命系统的多层次调控机制。
在理解生态环境方面,已有研究显示,整合的多生物标志物可用于评估生态系统的健康水平,并有效识别环境压力对生物体的影响[57]。2023 年,研究人员利用现场移植的贻贝对水体[58]、利用蒲公英对微塑料毒性[59]、利用双壳类动物识别和量化沿海污染水平[60] 等开展多生物标志物的整体监测,开发了整合生物响应指数(IBR)。为更好地表征沿海生态系统,有研究提出,应整合不同类型的生物标志物,并为所有层次进行定位,以应对可能因自然因素而发生的变化,为更好地了解水域环境中各种污染物的影响提供基线数据,通过加强贻贝物种在国内、城市和生态系统层面的污染管理,以更好地了解和保护环境[60]。
在利用整合微生物群落等构建资源转化技术方面,随着全球人口的不断增长和经济发展的加速,食品废弃物和农业废弃物的处理问题日益凸显。近年来,研究者在从食品废弃物[61]、农业废弃物[62]中开发生物活性物质和生物产品方面进行了广泛研究。在处理这些废弃物的过程中,越来越多的研究采用整合生物学的策略。2023 年,研究人员利用整合的微生态群落和多组学方法,以提高工程微生物对废物的利用率[63] ;同时,使用纳米胶囊技术提高了食品废弃物中生物活性分子的效能[64]。这些研究有助于探索将废弃物转化为有价值的资源,以实现资源的高效利用,促进环境的可持续发展。
3 展望
整合生物学以其跨层级研究、多学科整合、多维度分析等独特优势,已经成为生命科学与整合科学研究的重要交汇点。在当前科学发展的背景下,整合生物学方兴未艾,有望凭借其独特的整合理论、方法和能力,成为未来科技发展的制高点。
3.1 生命系统复杂性理论的深入研究
生命系统作为一个复杂体系,具有独特的生命系统动力学特征。随着对整合生物学的深入研究,人类对于生命系统在多个层次上的组织和运行方式,以及生命系统对环境的应答逐步加深理解,从而更深入地揭示生命系统的奥秘。这些深入研究,反映出生命科学与复杂科学的融合,目前相关研究正处于早期发展阶段,未来深入研究的方向将涵盖多个层面。
首先,生命系统普遍具有非线性特征,这种非线性特征使得系统展现复杂的行为,这使得生物体在面对复杂多变的环境时,展现出强大的适应性和生命力。在适应性形成的过程中,生命系统的自组织、自组装、自学习等特征将得到更加深入的阐释。这些特征使得生命系统能够不断地自我调整和优化,实现更高的组织水平和功能涌现。
再如,敏感性依赖是生命系统的另一重要特征。生命系统对初始条件非常敏感,微小的变化可能引发系统行为的显著变动。这种系统复杂性、环境变化敏感性使得生命系统在面临不确定性时能够迅速作出反应。
此外,生命系统还包含多种反馈机制。这些反馈机制有助于维持系统的稳定性与适应性。正反馈机制可能导致系统进入新的状态,负反馈机制则有助于抑制过度变化,使系统保持稳定。
目前,上述相关的探索已经开展,但尚未形成系统性理论。从难度上看,生命系统动力学过程通常具有不可还原性,意味着科学家无法仅通过分析系统组成部分来理解整体行为。这就要求相关研究在“干”“湿”研究的过程中,需要将“自上而下”和“自下而上”的研究系统进行整合,形成对系统的组织、运行方式以及应对环境变化的整体研究能力。这种整体研究能力形成的典型标志是深入揭示生命系统的功能涌现机制。例如,生物大分子能够组织成具有特定功能的细胞器,并在细胞内通过协同工作完成物质、能量和信息的交换,其过程涉及分子的自组装、细胞的自适应信息传导等,促使生命体系能够在有限的资源下实现高效的生命活动。尽管与之相关的自组装、自系统研究已在局部研究中有所展开,但如何实现整体功能的涌现有待深入探讨。
3.2 多学科交叉技术的融合运用
随着科技的不断进步,新的工具和方法不断涌现,为整合生物学提供了更多的可能性。例如,多组学技术快速发展,为系统性研究提供了更多的可能;基因编辑技术、合成生物学、纳米技术的融合也为利用类器官技术研究基因功能和调控机制带来前所未有的便利。
又如,生物影像技术的高清化和实时化,使得科学家们可以直观观察生物体内细胞和组织的结构和功能。光遗传学技术和共聚焦显微镜的运用,使研究人员能够在活体状态下实时观察神经元的行为和信号传导;同时,单细胞生物学的运用也为解析细胞分化和发育过程提供了重要信息。
再如,人工智能技术、生物信息学的进步为海量生物数据提供了强大的分析工具,使得研究人员能更高效地整合和分析跨层级的数据,揭示生物体的功能模块和调控网络,从不同层次和角度深入研究生物体的结构与功能。
多学科交叉技术相互补充、融合运用,使得生命系统的自组织、自学习、自适应等特性得以深入研究。通过复杂网络理论、信息论等交叉学科技术,能更好地理解生命系统中的组织原则,揭示生物体内部各种生物分子、细胞和组织器官之间的相互作用,生命系统在时间和空间上的组织规律;借助人工智能、仿生技术等,可以模拟生物体的学习过程,探讨生命系统在成长、适应和进化过程中不断适应环境保持稳定性的学习机制;利用跨学科知识,可以探讨生物体在不同环境中的适应策略,揭示生物体与环境的相互作用机制。
展望未来,多学科交叉技术的应用不仅能够丰富我们对生命系统的整体认识,还将为基于整合生物学理论开发各类解决方案提供更多可能。
3.3 理论支撑与方法创新的协同发展
复杂系统理论、计算生物学和数据科学为整合生物学提供了关键的方法和工具,其与生命科学现有研究的深入,或将使得从各维度全面深入地解析生命系统的复杂性和稳定性。
在这个过程中,理论支撑与方法创新的协同发展至关重要。理论研究人员通过不断探索新的生物学概念和模型,以解释复杂生物现象。同时,技术人员应致力于开发更高效、精确的计算方法和数据分析技术,以应对不断增长的生物学数据。只有通过不断探索新的生物学概念和模型,开发更高效、精确的计算方法和数据分析技术,加强跨学科、跨领域的交流与合作,才能在生命科学领域取得更多突破。因此,这种理论和方法的协同发展,是在更多维度和更深层次上揭示生命系统奥秘的必经之路。
未来,整合生物学将在生命科学的研究中继续发挥重要作用,为人类揭示更多生命系统的奥秘。同时,整合生物学的研究成果也将为整合科学的发展提供宝贵的启示。在全球范围内,科学家们将携手合作,共同探索生命科学的新领域,推动更多的突破与发展。
基金项目:国家自然科学基金(NFSC)-中国科学院(CAS)联合项目“整合生物学发展战略研究”(XK2023SMC001、L2324202);中国科学院文献情报能力建设专项(E3290422)子课题“生命科学与健康领域科技态势分析与服务”
*通信作者:E-mail: chendaming@sinh.ac.cn
[参 考 文 献]
张学博,博士,中国科学院上海营养与健康研究所生命科学信息中心馆员,主要从事生命科学及相关学科领域的战略情报研究,主持和参与上海市卫生健康委员会政策研究课题、国家自然科学基金委- 中国科学院联合项目等,为国家和区域的生命科学相关学科的发展和政策管理提供决策参考。
陈大明,中国科学院上海营养与健康研究所产业与技术情报部副主任,研究员,从事生命科学及其交叉学科的科技情报研究。近年来,带领团队完成了20 多项产业规划研究、知识产权分析、软科学研究项目,研究成果获华东地区科学技术情报成果奖一等奖等多个奖项。
《生命科学》是由中国科学院上海营养与健康研究所主办,国家自然科学基金委员会生命科学部和中国科学院生命科学和医学学部共同指导的综合性学术期刊。1988年创刊,原刊名为《生物学信息》内部发行;1992年起更名为《生命科学》,公开发行CN31-1600/Q,大16开,96页。本刊是“中文核心期刊” “中国科技核心期刊” “中国科学引文数据库来源期刊(CSCD)”。