读书笔记 | 癌症计算系统生物学 | Chapter 02 癌症分子生物学的基本原理

文摘   2024-11-14 06:35   中国香港  

第 02 章 癌症分子生物学的基本原理

目录

  • 目录

  • 前言

  • 2.1 突变的逐步积累

  • 2.2 癌症关键基因 (Cancer-critical genes)

    • 2.2.1 致癌基因 (Oncogenes)

    • 2.2.2 肿瘤抑制基因 (Tumor suppressor genes)

    • 2.2.3 非编码癌症关键基因 (Non-protein-coding cancer-critical genes)

  • 2.3 肿瘤细胞群体的演化

    • 2.3.1 克隆起源 (Clonal origin)

    • 2.3.2 癌细胞的干性 (Stemness of cancer cells)

  • 2.4 基因调控和信号转导机制的改变

    • 2.4.1 转录因子活性的修饰

    • 2.4.2 表观遗传修饰 (Epigenetic modifications)

    • 2.4.3 转录后调控的修饰

    • 2.4.4 信号转导的破坏

  • 2.5 癌症是一种网络疾病

  • 2.6 肿瘤微环境

  • 2.7 癌症的标志特征 (Hallmarks of cancer)

    • 2.7.1 标志性功能 (Hallmark capabilities)

    • 2.7.2 新兴标志特征 (Emerging hallmarks)

    • 2.7.3 促成特征 (Enabling characteristics)

  • 2.8 癌症中的染色体畸变

    • 2.8.1 癌症中的异常核型 (Abnormal karyotype in cancer)

    • 2.8.2 染色体畸变对癌症关键基因的影响

  • 2.9 结论

  • 练习

  • 要点

前言

人体由数千种细胞类型和数十亿个不同的细胞组成,这些细胞构成了许多组织。这些细胞根据信息流的程序完成其特定功能,该信息流由 Crick (1970) 在分子生物学中心法则 (central dogma of molecular biology) 中提出(参见附录)。癌细胞由这些正常细胞演变而来。癌症被分为四个主要类别,依据的是癌细胞来源的正常细胞类型。
大多数癌症 (80%) 来源于上皮组织的正常细胞,形成第一类癌症,称为癌瘤 (carcinomas)(例如乳腺、卵巢、宫颈、前列腺、肺、胰腺、结肠等)。所有其他癌症都来源于非上皮组织的正常细胞。第二类包括肉瘤 (sarcomas),它们源自结缔或支持组织(例如骨、软骨、脂肪、肌肉、血管)和软组织。第三类癌症来源于造血组织(即形成血液的细胞),包括淋巴瘤 (lymphomas) 和 白血病 (leukaemias)。最后一类癌症包括来源于中枢和外周神经系统的肿瘤,涵盖神经母细胞瘤 (neuroblastomas)神经鞘瘤 (schwannomas) 和 **髓母细胞瘤 (medulloblastomas)**。除了会在血液中生成循环肿瘤细胞的白血病外,所有的癌症都形成实体瘤。癌症是一种在形态学、临床和分子特征上异质性极强的疾病(参见第 1.4 节)。
尽管癌症具有多样性,它们也共享许多共同特征。本章详细描述了将正常细胞转变为癌细胞的事件系列,即**肿瘤进展 (tumour progression)。影响基因调控和信号转导机制的分子改变被详述。所有癌症中共同的特征被称为标志 (hallmarks),将依次列举,特别关注染色体畸变。为了帮助理解癌症的生物学,本章简要概述了相关的基本原理。Weinberg (2007) 和 Alberts 等人 (2002) 所著的书籍以及 Hanahan 和 Weinberg (2000, 2011) 的经典综述值得深入研究以获得更多细节。本章假设读者已经熟悉细胞的分子生物学基本原理 (basic principles of molecular biology of the cell)**,这些内容也在附录中进行了回顾。

2.1 突变的逐步积累

在生命周期中,细胞会死亡,并且必须被替换以维持生物体的完整性。因此,细胞会在细胞周期内复制(参见 Box 2.1)。在一个正常的人体中,一生中约发生  次细胞分裂。在细胞分裂过程中,DNA 复制和修复的精确性存在固有的限制,因此突变 (mutations) 会以每个基因每次细胞分裂大约  的频率自发地发生 (Komarova, 2005)。主要的改变是点突变(即一个核苷酸的修饰)、插入、缺失或 DNA 序列的**扩增 (amplification)。基因序列中的突变可能会改变基因产物的结构和功能。然而,在某些情况下,突变是中性的 (neutral)(即导致的氨基酸不同但化学性质相似)甚至是静默的 (silent)**(即不改变氨基酸)。在癌症背景下,突变被视为一种遗传改变,对应于 DNA 序列的改变,进而影响基因产物和相关细胞机制。

Box 2.1:细胞周期 (Cell cycle)

细胞周期可分为四个连续的阶段:G1、S、G2 和 M。在 G1 期,细胞生长并为 S 期做好准备,在 S 期中 DNA 复制发生。从一个双链 DNA 分子(染色体)开始,形成两个相同的双链 DNA 分子(称为姐妹染色单体),并由黏连蛋白连接在一起。G2 期是从复制结束到有丝分裂开始之间的时间间隔。在 M 期,复制的 DNA 分子被分离到子细胞中。姐妹染色单体分开,使得子细胞每个获得一份染色体的副本。细胞周期就是通过这四个阶段的过程。
突变也可能由于接触诱变剂(例如化学物质如烟草烟雾,物理因素如紫外线,或生物因子如病毒)而发生。结果是,在一生中,每个基因可能在约  个独立的场合下经历突变。在产生的突变细胞中,许多可能具有扰乱的机制,导致基因调控的紊乱。因此,细胞的和谐行为及其邻近细胞的关系也会受到影响。这些变化会遗传给细胞的后代。在细胞周期过程中,还可能发生不可遗传的非基因突变。它们对应于表观遗传特征的修饰(参见第 2.4 节),被称为**表突变 (epimutations)**。因此,突变的数量,包括基因突变和表突变,可能大于每个基因  次。
根据上述数据,关于癌症的问题不在于“为何它会发生?”而是“为何它发生得如此罕见?”。显然,单个突变足以将典型的健康细胞转化为无限增殖的癌细胞,但这样的生物体可能无法生存。希望防御机制(如细胞凋亡)可以消除生物体中的癌细胞。因此,多次突变被认为是将一个正常细胞转化为可以逃避这些机制并无限增殖的癌细胞所必需的。
为什么需要这么多的突变?一种解释是,细胞过程以复杂且互相联系的方式受到控制:细胞使用冗余的调控机制来帮助维持其行为和完整性的严格控制。因此,必须破坏许多不同的调控系统,细胞才能抛弃其正常的约束,成为一个恶性癌细胞。此外,肿瘤细胞在演化过程中每一个阶段可能遇到新的障碍,需要进一步获得附加的突变。因此,癌症是一个多步骤过程,需要累积多个突变 (Vogelstein and Kinzler, 1993)。这也解释了其患病率为何会随着个体年龄的增加而上升。
然而,一些癌症(如小儿癌症)涉及更少的复杂肿瘤发生 (tumorigenesis) 机制,其中仅一个驱动突变就足以触发肿瘤生长。
本质上,癌症是一种遗传性疾病,但由体细胞突变 (somatic mutations) 引起,而其他遗传疾病是由生殖系突变引起的。然而,存在癌症的家族性形式。在这些情况下,从父母遗传的突变可能已存在于体内所有细胞中,并代代相传。例如,在乳腺癌中,大约 15% 的病例可归因于遗传性易感性,即基因突变的存在。乳腺癌中的著名案例包括 BRCA1 和 BRCA2 基因突变,这些基因在细胞周期中参与 DNA 修复。这两个基因约占乳腺癌家族风险的 16%。由于突变在细胞中持续存在,BRCA 基因的正常功能仅依赖于剩余的野生型等位基因。因此,携带 BRCA1 或 BRCA2 突变的患者患乳腺癌的风险提高了 10 至 20 倍 (Stratton and Rahman, 2008)。无论哪种癌症,新易感等位基因的鉴定在癌症预防策略的实施中具有直接应用价值。

2.2 癌症关键基因 (Cancer-critical genes)

癌症是一种由多种突变累积引起的基因疾病。在肿瘤进展中发生改变的最重要基因被称为癌症关键基因 (cancer-critical genes) (Alberts 等, 2002)。其中大部分已知的癌症关键基因被收录于 Vogelstein 和 Kinzler (2004)、Bunz (2008) 的研究中,以及癌症体细胞突变目录 (Catalogue of Somatic Mutations in Cancer, COSMIC) (Forbes 等, 2008, 2011) 中。癌症关键基因根据基因产物活性水平对癌症风险的影响分为两类。

2.2.1 致癌基因 (Oncogenes)

第一类致癌基因包含那些由于功能增益突变而增加癌症风险的基因。这些基因称为原癌基因 (proto-oncogenes),其突变和过度活跃的形式称为致癌基因 (oncogenes)(见 图 2.1A)。致癌基因编码控制细胞增殖、凋亡或二者的蛋白质。它们可以通过突变引起的结构改变(见 图 2.2A)、扩增 (amplification)(见 图 2.2B)以及染色体重排引发的基因与增强子元件的并列(见 图 2.2C1)或融合基因(见 图 2.2C2)而被激活 (Croce, 2008; Alberts 等, 2002)。突变和易位 (translocations) 可作为癌症发生或进展中的起始事件,扩增通常发生在肿瘤进展过程中。
致癌基因的产物可分为六大类:转录因子(例如 MYCN 在神经母细胞瘤中的扩增)、染色质重塑因子(例如在白血病中与 MLL 融合的基因)、生长因子(例如 FGF4 在卡波西肉瘤 (Kaposi’s sarcoma) 中的扩增)、生长因子受体(例如 FGFR3 在膀胱癌中的突变,见 第 5.5.5 节)、信号传导分子(例如 KRAS 在结肠癌中的突变)和凋亡调节因子(例如在淋巴瘤中的 BCL2 融合基因)。
MYC 致癌基因家族的示例:在神经母细胞瘤中,经常观察到 MYCN 的扩增导致该蛋白质的过度产生(见 图 2.2B)。其他机制,如易位和融合基因也起重要作用 (Mitelman 等, 2007)。例如,当原癌基因发生易位并接近一个正常情况下调控基因高水平表达的 DNA 区域时,原癌基因会被高度转录并转变为致癌基因(见 图 2.2C1)。在伯基特淋巴瘤中,MYC 与免疫球蛋白重链 IGH 基因的调控元件并列,导致 MYC 基因持续活跃,因为其表达由免疫球蛋白调控元件驱动。在这种情况下,易位导致了原癌基因的上调。
EWS/FLI1 致癌基因的示例:易位还可以通过融合两个现有基因产生一个新的嵌合基因或融合基因(见 图 2.2C2)。这种现象发生在尤文氏肉瘤 (Ewing’s sarcoma) 中,在 11 号和 22 号染色体之间的易位将 EWS 基因和 FLI1 基因合并为嵌合致癌转录因子基因 EWS/FLI1。在这些肿瘤中,融合基因主要与 FLI1 有关,而与其他基因的频率较低。
image-20241105044346633
图 2.1 致癌基因和肿瘤抑制基因 (Oncogene and tumour suppressor gene)
(A) 致癌基因具有显性特征:一个基因拷贝的功能增益突变就可以引发癌症。
(B) 肿瘤抑制基因通常是隐性基因:基因的两个等位基因都必须失活才能引发癌症。该规则有例外情况,详细信息见 图 2.3。激活和失活突变分别用黑色和白色方框表示。
图片和图例改编自 Alberts 等人 (2002)。
image-20241105050014765
图 2.2 从原癌基因到致癌基因 (From proto-oncogene to oncogene)
将原癌基因转变为致癌基因的三种机制:(A) 突变、(B) 基因扩增和 (C) 染色体重排。图片改编自 Alberts 等人 (2002)。

2.2.2 肿瘤抑制基因 (Tumour suppressor genes)

第二类基因涉及那些由于功能丧失突变 (loss-of-function mutations) 而增加癌症风险的基因。这些基因被称为肿瘤抑制基因,通常具有预防癌症的作用,一般仅需存在一个功能性基因即可发挥作用。
要导致癌症,这些基因通常需要在肿瘤中经历双等位基因失活 (biallelic inactivation);这被称为 Knudson 的双击模型 (two-hit model)(参见 图 2.1B图 2.3A 和 Knudson, 1971)。单个突变等位基因的遗传增加了肿瘤的易感性,因为仅需一个额外突变即可导致基因功能的完全丧失。这也是为何一些肿瘤抑制基因在家族性癌症中被鉴定出来的原因,例如在视网膜母细胞瘤 (retinoblastoma) 中的 RB 基因 (Knudson, 1971)。RB 编码一个参与细胞周期控制的蛋白质,其活性在几乎所有类型的癌症(Weinberg, 2007)中失调,包括家族性和散发性 (sporadic) 的形式,如骨肉瘤 (osteosarcomas)乳腺癌 (breast carcinomas)小细胞肺癌 (small cell lung carcinomas)膀胱癌 (bladder carcinomas) 和黑色素瘤 (melanomas)。与致癌基因类似,肿瘤抑制基因也参与多种功能 (Sherr, 2004)。在肿瘤抑制基因中,值得提及的是 TP53,该基因编码一个在基因组完整性维护中发挥关键作用的转录因子;ATM 编码一个参与 DNA 损伤信号转导的蛋白激酶(参见 图 A.6);BRCA1 和 BRCA2 是参与 DNA 修复的基因,突变会导致乳腺癌和卵巢癌。
image-20241105050245931
图 2.3 肿瘤抑制的模型 (Models of tumour suppression)
对于不同的模型,疾病的严重程度可以通过基因表达水平的函数来解释。
(A) 在 Knudson 双击模型 (two-hit model) 中,需要两个突变来失活肿瘤抑制基因并促进肿瘤发生。在视网膜母细胞瘤中 RB 基因即是如此。
(B) 在 单倍剂量不足 (haploinsufficiency) 的情况下,肿瘤抑制基因的单等位基因失活即可形成癌症,而双等位基因失活会增强肿瘤进展和转移。此机制在 TP53 中发生。
(C) 在肿瘤抑制基因的 连续模型 (continuum model) 中,稍微降低基因表达水平或蛋白活性即可增加疾病的严重程度。
(D) 连续模型也可应用于致癌基因;增加致癌基因的表达水平会加剧疾病的严重性。
图片改编自 Berger 等人 (2011)。

RB 肿瘤抑制基因的示例

如果从一个亲本遗传或在复制期间自发产生的突变发生在 RB 的一个等位基因中,该等位基因编码的蛋白质将无法发挥功能。然后,第二个事件发生。例如,携带突变的染色体重复后,功能性基因的染色体丢失(即 杂合性丧失 (Loss of Heterozygosity, LOH),见 图 2.13B)。因此,RB 存在于两个非功能性拷贝中,且不再能够控制细胞周期。这就是 Knudson 的双击模型。根据 图 2.13 中显示的不同畸变配置,我们可以想象其他导致相同效果的改变组合。
Knudson 的双击模型暗示了两个等位基因的失活才能启动肿瘤发生(参见 图 2.1B 和 图 2.3A)。然而,有证据表明,不仅双等位基因失活,还存在单等位基因失活 (monoallelic inactivation) 也可能导致癌症。主要机制被称为负显性 (negative dominance) 和单倍剂量不足 (haploinsufficiency) (Berger 和 Pandolfi, 2011)。例如,在单倍剂量不足的情况下(见 图 2.3B),TP53 的单个拷贝丧失对于抑制肿瘤形成是重要的。单倍剂量不足模型和双击模型是离散模型,因为连续的突变逐步失活每个等位基因。Berger 和 Pandolfi (2011) 提出了一种**连续模型 (continuum model)**,假设即使肿瘤抑制基因的基因表达水平或蛋白质活性稍微降低也与癌症形成相关。癌症的严重程度与肿瘤抑制基因表达水平的减少形成的连续体相关,而不是 DNA 拷贝数的离散变化(参见 图 2.3C)。

2.2.3 非编码癌症关键基因 (Non-protein-coding cancer-critical genes)

除了编码蛋白质的基因外,非编码 RNA (ncRNA),特别是微小 RNA (microRNA, miRNA) 也可以充当致癌基因或肿瘤抑制基因 (Esquela-Kerscher and Slack, 2006; Fabbri et al., 2008)。miRNA 基因调控的缺陷导致 miRNA 的丢失或扩增,已在多种癌症中报道 (Calin and Croce, 2006)。通常情况下,靶向致癌基因的 miRNA 的低表达或靶向肿瘤抑制基因的 miRNA 的过表达会对癌症的发展产生影响(见 图 2.4)。
image-20241105051124001
图 2.4 miRNA 在癌细胞中的作用 (Role of miRNA in a cancer cell)
在微小 RNA (miRNA) 生物合成中出现的任何缺陷(以问号表示)都可能导致靶蛋白水平的异常。
(A) 作为肿瘤抑制因子的 miRNA 的减少或缺失会导致靶致癌蛋白的意外高水平。
(B) 作为致癌基因的 miRNA 的扩增或过表达会导致靶肿瘤抑制蛋白的消除。
图片和图例改编自 Esquela-Kerscher 和 Slack (2006)。

2.3 肿瘤细胞群体的演化 (Evolution of tumour cell populations)

2.3.1 克隆起源 (Clonal origin)

肿瘤细胞群体的克隆演化理论由 Nowell (1976) 提出,认为肿瘤细胞起源于单个细胞,该细胞积累了一系列突变,如前所述。该模型认为肿瘤的发展是通过类似于达尔文的进化过程进行的,其中一系列随机的遗传改变,每一种都赋予一种或另一种类型的生长优势,从而被选择并导致正常细胞向癌细胞的渐进转变 (Hanahan and Weinberg, 2000)。从一个最初略微异常的细胞群体开始,单个突变祖细胞的后代通过突变和自然选择的连续循环从坏变得更糟。在每个阶段,一个细胞获得了一个额外的突变,赋予它相对于邻近细胞的选择优势,使其更适应肿瘤内的环境——可能是氧气不足、营养稀缺的条件。这个适应性良好的细胞将继续分裂,最终成为癌症中占主导地位的克隆。因此,肿瘤的生长是断续的,随着新的优势突变的出现,携带这些突变的细胞开始增殖。

2.3.2 癌细胞的干性 (Stemness of cancer cells)

正常干细胞具有自我更新的能力,意味着它们可以进行分裂,使其数量保持不变,并产生各种分化的细胞。与干细胞类似,癌症干细胞 (Cancer Stem Cells, CSC) 也具有相同的特性。在 CSC 模型中,肿瘤被视为一种异常的器官,由干细胞驱动其生长(见 图 2.5)。该模型表明,在具有特定遗传改变的癌症中,存在具有不同恶性潜能的细胞类型混合体。
image-20241105051320514
图 2.5 根据 CSC 模型的肿瘤分层结构 (Hierarchical organisation of a tumour according to the CSC model)
癌症干细胞 (CSCs) 在肿瘤进展过程中获得额外的遗传改变,这些改变对肿瘤可能是有利的。这些附加改变在肿瘤内部形成新的亚群。每个 CSC 都具有自我更新和产生更多分化细胞的能力。在该模型中,选择压力预计作用于 CSC 水平。虚线箭头表示由于突变积累,分化细胞可能被重新转化为干细胞的可能性。
图片和图例改编自 Vermeulen 等人 (2008)。
在肿瘤中,存在失去传播肿瘤能力的分化细胞,以及保留克隆生成能力的细胞。所提出的肿瘤分层结构可以很容易地纳入 Nowell 理论中的经典克隆选择模型中。如前所述,该理论将肿瘤视为由克隆衍生的细胞群体,获得潜在的新优势突变,并产生新的、更快速增殖的克隆。当将 CSC 理论整合到此模型中时,选择压力被预测在 CSC 群体层面上起作用。然而,这并不意味着肿瘤中只存在于更多分化细胞中的某些特征无法受到选择,特别是如果它们增加了 CSCs 的生长率 (Vermeulen et al., 2008)。
CSC 模型仍存在争议,问题在于 CSC 的起源细胞是否必须是干细胞,还是突变的积累将分化的细胞重新转化为干细胞。在该理论中,唯一能够启动和驱动肿瘤生长的细胞是 CSC,因此假设转移 (metastasis) 也是由 CSC 引起的是合理的。

2.4 基因调控和信号传导机制的改变 (Alterations of gene regulation and signal transduction mechanisms)

在正常细胞中,基因调控和信号传导涉及分子生物学中心法则中的不同机制(参见 附录 A.1.2)。在此,我们列举一些因突变逐步积累而导致的癌细胞中这些机制的改变。

2.4.1 转录因子活性的改变 (Modification of transcription factor activity)

在癌症中,许多转录因子参与了肿瘤进展机制。最著名的例子是肿瘤抑制基因 TP53,也被称为“基因组的守护者 (guardian of the genome)”;它在保持基因组完整性方面扮演关键角色(参见 节 A.1.2)。由于基因中的突变,TP53 在许多癌症中直接受到影响。编码该蛋白的基因在 30% 到 50% 的常见人类癌症中发生突变(数据来源于 Weinberg, 2007)。因此,突变的 TP53 失去了其转录因子的部分功能,因为它无法再与其所有靶基因结合,这些基因也无法再转录为信使 RNA (mRNA) (Vogelstein and Kinzler, 2004)。因此,当 TP53 突变时,它无法有效地发挥其守护者的角色。

2.4.2 表观遗传修饰 (Epigenetic modifications)

在正常细胞中,表观遗传模式作为基因转录的调控机制,并参与基因组稳定性(参见 附录)。在癌症中,这些模式根据肿瘤进展期间发生的三种修饰类型而发生改变(参见 图 2.6 和 图 2.7)。
image-20241105051814846
图 2.6 癌症进展过程中表观遗传的改变 (Epigenetic alterations during tumour progression in carcinomas)
在肿瘤进展过程中,正常细胞经历转化,并经过不同阶段,包括增生 (hyperplasia)异常增生 (neoplasia) 和浸润。在这一过程中,总体 DNA 甲基化含量逐步减少,高甲基化的 CpG 岛频率增加,以及组蛋白修饰失衡也在增加。5mC 代表 5-甲基胞嘧啶 (5-methylcytosine),它是 DNA 甲基化的结果。
图片改编自 Esteller (2008)。
首先,肿瘤中的 DNA 低甲基化 (hypomethylation)(参见 图 2.7A2)相比其正常组织的 DNA 甲基化水平(参见 图 2.7A1)是人类癌症中发现的首个表观遗传改变。癌细胞的特征是 DNA 甲基化的大量全局损失,总体上 5-甲基胞嘧啶含量减少约 20-60% (Portela and Esteller, 2010)。这种甲基化的丢失主要是由于重复 DNA 序列的低甲基化和基因贫乏区域的广泛低甲基化。在疾病的发展过程中,随着病变从良性细胞增殖向侵袭性癌症转变,基因组 DNA 的低甲基化程度增加。这种低甲基化会增加染色体不稳定性,导致缺失、易位和染色体重排(参见 节 2.8)。这种现象在乳腺癌细胞系中也有观察到 (Shann et al., 2008)。此外,DNA 中甲基的丢失也会导致基因组印记 (genomic imprinting) 的丧失,并可能导致某些癌症类型中的基因激活。IGF2 基因即是一个案例,它增加了结直肠癌的风险 (Esteller, 2008)。
接下来,启动子 CpG 岛的高甲基化 (hypermethylation) 是肿瘤进展中的关键过程,导致肿瘤抑制基因的转录沉默(参见 图 2.7C2)。在正常细胞中,启动子通常不被甲基化,以允许转录(见 图 2.7C1)。在启动子 CpG 岛内,特定位点(即核心区域)的高甲基化在基因沉默中起着重要作用 (van Vlodrop et al., 2011)。肿瘤抑制基因中 CpG 岛的高甲基化特征与癌症类型特异性相关。高甲基化可以是 Knudson 双击模型中的一种病变。
最后,组蛋白修饰模式的全局改变 (global alterations of histone modification patterns) 可能影响基因组结构和完整性,并扰乱正常的基因表达模式。根据其转录状态,人类基因组可分为活跃转录的常染色质和转录不活跃的异染色质。在正常细胞中,异染色质的特征是低水平的乙酰化和高水平的某些甲基化(见 图 2.7B1),而常染色质的特征是高水平的乙酰化(见 图 2.7D1)。在癌细胞中,甲基化和乙酰化标记发生改变,影响基因转录(见 图 2.7B2 和 图 2.7D2)。与 DNA 甲基化的改变一样,这些修饰可能是癌症的致因因素。在膀胱癌中,Stransky 等人 (2006) 表明某些组蛋白甲基化可以在大基因组区域发生,并导致该区域内相邻基因的表达丧失。这一现象被称为长距离表观遗传沉默 (long-range epigenetic silencing)。在结直肠癌中,Frigola 等人 (2006) 发现这一长距离表观遗传沉默现象与组蛋白甲基化水平的改变有关,并且可能与 DNA 甲基化相关联。
image-20241105052037920
图 2.7 正常细胞和癌细胞中的表观遗传模式 (Epigenetics patterns in a normal and cancer cells)
该图描述了癌细胞中观察到的 DNA 甲基化和组蛋白修饰模式(虚线框),与其正常组织的对应部分相比。
(上半部分)重复序列被 DNA 甲基化 (A1) 和组蛋白甲基化 (B1) 所沉默。这些修饰防止染色体不稳定、易位和通过内寄生序列的再激活引起的基因破坏。在癌细胞中,DNA 甲基化减少 (A2),组蛋白甲基化也减少 (B2)。
(下半部分)对于转录活跃的基因,其启动子区域的 CpG 岛未甲基化 (C1)。然而,基因体内的甲基化促进了转录并防止了伪转录起始位点的出现。组蛋白乙酰化 (D1) 允许转录因子和聚合酶的结合,以启动转录。在癌细胞中,组蛋白甲基化和乙酰化标记的修饰影响基因调控 (B2 和 D2)。
图片和图例改编自 Portela and Esteller (2010); Rodríguez-Paredes and Esteller (2011); Gibney and Nolan (2010); Taby and Issa (2010); Schones and Zhao (2008)。
在乳腺癌中,基因组中异常甲基化区域的分布也被发现是非随机的,且倾向于集中在相对较小的基因组区域,覆盖到数百千碱基 (Novak et al., 2006, 2008)。所有上述的表观突变 (epimutations) 都可能是 Knudson 双击模型中的一种病变,因为它们可以沉默一个或两个肿瘤抑制基因的等位基因。对所有这些表观遗传改变的理解及其对肿瘤进展的贡献,对于进一步在诊断、预后 (prognosis) 和治疗领域的进展至关重要 (Jovanovic et al., 2010)。

2.4.3 转录后调控的修饰 (Modification of the post-transcriptional regulations)

在转录后,RNA 转录本可以通过不同的剪接 (alternative splicing) 被加工成不同的 mRNA,以增加蛋白质的多样性(参见 图 A.4)。在癌细胞中,存在一些在正常细胞中未发现的异常剪接形式 (Venables, 2004; Srebrow and Kornblihtt, 2006; Kim et al., 2008)。这些异常剪接为细胞提供了新的功能。此外,如第 2.2 节所述,miRNA 可以作为致癌基因或肿瘤抑制基因。因此,任何影响 miRNA 生物合成及其结合靶基因的能力的改变都会阻碍其在编码蛋白质基因调控中的重要作用 (Calin and Croce, 2006)。

2.4.4 信号转导的破坏 (Disruption of signal transduction)

任何改变信号传递的信号通路 (signalling pathways) 的破坏都与癌症的发展有关。例如,肿瘤抑制激酶基因 ATM 的失活会阻止 TP53 激活,并在 DNA 损伤情况下影响细胞的完整性。另一个例子是 HER2 致癌基因(也称为 ERBB2)的过表达。HER2 是膜表面受体酪氨酸激酶,通常参与细胞生长和分化的信号传导通路。在约 20% 的乳腺癌中,HER2 激酶由于扩增 (amplification) 而过表达(见 节 2.8),从而引发信号传导级联反应的广泛激活,导致高侵袭性和高转移风险的癌症。
一般情况下,信号转导的改变可能表现为信号放大的缺失(当信号应被放大时)或信号的过度放大(当信号不应被放大时)。蛋白激酶是控制信号转导级联反应的关键参与者,常在癌症中发生改变。因此,它们成为药物的治疗靶点。例如,伊马替尼 (imatinib) 和 吉非替尼 (gefitinib) 是小分子激酶抑制剂,而 曲妥珠单抗 (trastuzumab) 是一种靶向 HER2 激酶受体的抗体。
image-20241105052533923
图 2.8 细胞中的信号通路 (Signalling pathways in the cell)
许多不同且互相关联的信号通路使细胞能够整合环境刺激。这一复杂的网络传递命令,使细胞能够生存、繁殖或死亡。
图片改编自 Hanahan 和 Weinberg (2000)。

2.5 癌症是一种网络疾病 (Cancer is a network disease)

在细胞中,许多不同的信号通路和基因调控网络调节特定的细胞过程(参见 图 2.8 和 Box 4.3)。虽然每个通路和网络都参与特定的功能,但它们并不是独立的,而是通过复杂的交叉通信紧密相连。如前所述,癌症是一种基因疾病,但需要在一生中积累多步骤的突变和缺陷。这可以理解为调控因子之间的巨大而复杂的互连,旨在使细胞在应对扰动时保持稳健(参见 第 9 章)。因此,肿瘤的进展不仅可以被视为一种基因疾病,也是一种网络疾病。因此,系统生物学方法为肿瘤进展建模提供了一个自然的框架。

2.6 肿瘤微环境 (Tumour microenvironment)

实体肿瘤由癌细胞和非癌细胞的混合物组成。后者包括成纤维细胞、免疫细胞、周细胞和内皮细胞,统称为基质细胞 (stromal cells)。这使得肿瘤成为一个非常复杂的系统,因为许多不同类型的细胞同时存在。此外,由于每个细胞会释放多种生物分子,肿瘤所处的环境也非常复杂。显然,肿瘤生物学已无法仅通过列举癌细胞的特性来理解,而必须考虑到肿瘤微环境 (tumour microenvironment) 对肿瘤进展的贡献。微环境的一个主要成分是**细胞外基质 (Extracellular Matrix, ECM)**。在癌症中,ECM 常常失调,变得无序,并影响肿瘤进展 (Lu et al., 2012)。理解肿瘤微环境的作用是一个巨大的挑战,需要复杂的整合方法。将讨论整合肿瘤微环境作用的数学模型(参见 节 8.1.3)。
微环境不仅在肿瘤发生中发挥作用,而且在药物反应和肿瘤对治疗的耐药性方面也有重要作用。事实上,为了让抗癌药物杀死癌细胞,药物必须分布于整个肿瘤血管系统、穿越血管壁并扩散至肿瘤组织 (Trédan et al., 2007)。此外,药物运输、吸收和代谢的效率取决于患者的遗传背景,例如单核苷酸多态性 (Single Nucleotide Polymorphism, SNP) 会影响药物动力学和药效学 (Wiechec and Hansen, 2009)。考虑到药物反应的遗传变异性,将是癌症个性化治疗的重要组成部分。

2.7 癌症的标志特征

癌症关键基因中的突变逐渐累积,改变了基因调控和信号传导机制。虽然可能发生各种各样的突变,但所有癌症都具有一些共同的特征。实际上,要成功发展成肿瘤,细胞必须在进化过程中获得一系列异常特性和新的“技能”。不同的癌症需要不同的特性组合,然而我们可以总结出癌细胞的若干典型行为。

2.7.1 标志能力

image-20241106085724170

图 2.11 癌症的标志特征

几乎所有的癌症在其发展过程中都获得了相同的六种功能能力,尽管通过不同的机制策略。这种能力的获得得益于促成特征。此外,肿瘤还表现出共同的新兴标志特征。图片改编自 Hanahan 和 Weinberg(2000, 2011)。
Hanahan 和 Weinberg(2000)提出,大量癌细胞基因型的多样性体现了六种获得的能力,这些能力改变了细胞生理并决定了恶性生长(见图 2.11)。这些能力包括:
  • 维持增殖信号(sustaining proliferative signalling):癌细胞可以在没有外源生长信号的情况下自行增殖。
  • 逃避生长抑制(evading growth suppressors):癌细胞对阻止细胞增殖的信号不敏感。
  • 激活侵袭和转移(activating invasion and metastasis):肿瘤可以侵袭邻近组织,产生先导细胞离开原发肿瘤部位∗并转移。
  • 实现复制不朽性(enabling replicative immortality):癌细胞变得不朽,能够经历无限次连续的细胞周期分裂。
  • 诱导血管生成(inducing angiogenesis):肿瘤可以诱导新生血管的形成,以便获得营养并排出废物。
  • 抵抗细胞死亡(resisting cell death):细胞死亡机制无效。
这六种标志性能力可以归纳为三种主要特性,使得癌细胞能够增殖、生存和扩散。
第一个特性是细胞周期控制的缺陷(即维持增殖信号和逃避生长抑制的标志)。细胞周期通常确保生物体内的细胞数量保持恒定,即当一个细胞死亡时会产生一个新的细胞。因此,细胞周期必须精确控制。在癌症中,这种控制失效,细胞不断增殖。细胞周期涉及多种机制。这里仅提及 RB 的关键作用,它控制细胞周期的启动。当 RB 处于活性状态时,通过抑制转录发挥细胞周期“刹车”的作用。这种抑制通过隔离 E2F 转录因子家族实现,E2F 负责调控细胞周期、DNA 复制和凋亡相关基因的转录。当细胞接收到适当的外部信号(如生长因子)时,刹车解除,细胞进入复制阶段。RB 活性依赖于去磷酸化状态,当 RB 被 G1 期细胞周期依赖性激酶(CDK4/CCND1 或 CyclinD1)以及后续其他激酶复合物(如 CDK2/CCNE(CyclinE)和 CDK2/CCNA(CyclinA))磷酸化后失去对 E2F 的控制(见图 2.9)。在癌症中 RB 通路缺陷可以因以下情况出现:(1) 外部信号持续存在(例如,生长因子总是存在或其受体突变,导致细胞认为信号始终开启)(见 8.1.1 节的数学模型综述),(2) 细胞对抗生长因子(如 TGFβ)不敏感(见 8.1.2 节的数学模型综述),或 (3) 通过限制点的过程被突变或细胞功能失调所扰乱(Sherr, 1996)(见第 7 章)。在许多癌症中,RB 活性本身的改变源于基因缺失、启动子高甲基化、病毒致癌蛋白的存在、杂合性丢失(LOH)或激酶或激酶抑制剂的失调。
image-20241106090047975
图 2.9 调节 RB 活性的机制简化表示
外部信号(如促分裂原)触发 CyclinD/CDK 蛋白复合物的激活,该复合物随后开始磷酸化并抑制 RB,从而释放 E2F,进而激活细胞周期基因的转录。更真实和全面的表示见图 4.5。
Box 2.2:限制点
限制点是一个不可逆的转变,发生在 G1 期的后期,此后细胞承诺进行 DNA 复制和细胞周期进展。在没有生长因子的情况下,细胞进入 G0(或静止)状态。在存在生长因子的情况下,细胞受到刺激并通过 G1 期。在限制点转变之前,细胞对正负外部因素均有反应(Pardee, 1974)。然而,当细胞在 G1 期晚期通过限制点后,它承诺进行细胞周期事件并继续进行 DNA 合成。在此之后,即使生长因子被移除,并且在没有其他细胞功能障碍的情况下,细胞仍然完成其周期,直到下一轮前停止。
第二个特性是细胞死亡控制的缺陷(即实现复制不朽性和抵抗细胞死亡的标志)。细胞死亡过程即细胞破坏过程。首先,当细胞经历一定次数的细胞周期后,该机制会发生,这是衰老(senescence)过程,由每次细胞周期中发生的端粒缩短引起。其次,当细胞周期中基因组完整性受损时,细胞会进行自我毁灭,称为凋亡(apoptosis)。在凋亡过程中,机制可以大致分为传感器和效应器两类。传感器(即参与信号传导的蛋白质)负责监测细胞内外环境是否正常,并决定细胞生存或死亡(见 A.1.2 节)。这些信号调节效应器类组件,后者执行凋亡过程。效应器中的主要角色之一是 TP53,当 DNA 复制期间发生损伤时,它可以触发凋亡。凋亡缺陷可能由 TP53 和传感器(如 ATM)突变引起(见 8.1.5 节的数学模型综述)。
最后一个特性是侵袭性和转移潜能(即激活侵袭和转移以及诱导血管生成的标志)。细胞的失控增殖导致其原发器官损伤。此外,如果侵袭了邻近组织,可能还会损伤邻近器官(见 8.1.3 节的数学模型综述)。此外,肿瘤具有诱导新血管形成的能力。这一过程称为血管生成(angiogenesis)(见 8.1.4 节的数学模型综述)。因此,肿瘤可以将癌细胞释放到血液中。结果,患者血液中通常会观察到循环肿瘤细胞(Circulating Tumour Cells, CTC)。这些细胞构成了种植转移灶的储备,能够在远处组织中形成转移。通过全身扩散,癌症几乎无法通过手术或局部放射治疗根除,从而可能致命。转移是导致 90% 人类癌症死亡的原因(Hanahan 和 Weinberg, 2000)。Chaffer 和 Weinberg(2011)提出,复杂的转移过程可以分为两个主要阶段。第一阶段是癌细胞从原发肿瘤转移至远处组织,第二阶段是对目标组织的定植。
在发育生物学中使用的上皮-间质转化(Epithelial-to-Mesenchymal Transition, EMT)∗ 概念可以解释胚胎早期形态发生机制,以及逆过程(间质-上皮转化,MET),这可能为破解转移机制提供基础(Chaffer 和 Weinberg, 2011;Thompson 和 Haviv, 2011)。除了发育生物学,流体力学理论也提供了一个有趣的框架来模拟肿瘤侵袭(Guiot 等人, 2007b,a;Shieh 和 Swartz, 2011;Shieh 等人, 2011;Wirtz 等人, 2011)。实际上,肿瘤组织和其依赖的正常组织可以看作是具有各自流变特性(如粘度和弹性)的两种不同流体。只要这些特性在肿瘤进展中保持稳定,两种流体则保持分层状态,肿瘤局限于原位。然而,肿瘤进展过程中会发生生物物理和生物化学改变,影响肿瘤微环境和周围组织的流变特性。结果,平衡状态可能被打破,两种流体可能混合,从而允许肿瘤侵袭邻近组织,与水滴的行为类似(见图 2.10)。
image-20241106085324103
图 2.10 宫颈癌中的肿瘤进展和侵袭
(A) 在重度不典型增生状态下,存在形态异常的细胞。(B) 在浸润性癌症中,癌细胞渗入邻近组织,类似于水滴渗透的现象。虚线将癌细胞(上方部分)与邻近组织(下方部分)分隔开。图片由居里研究所(Institut Curie)的 Xavier Sastre-Garau 博士提供。© 2012 居里研究所。(见彩图插页)

2.7.2 新兴标志特征

Hanahan 和 Weinberg(2011)提出了两个其他标志特征,称为新兴标志特征(emerging hallmarks),它们也涉及肿瘤发生过程:
  • 重编程能量代谢(reprogramming energy metabolism):癌细胞调整了能量代谢,以促进细胞生长和分裂,从而维持不受控制的细胞增殖。
  • 逃避免疫破坏(evading immune destruction):肿瘤能够避开免疫系统的检测,或能够限制免疫杀伤的范围,从而避免被摧毁。
关于能量代谢,第 8.1.8 节将回顾已有的数学模型。

2.7.3 促成特征

在肿瘤进展过程中,不同的机制允许正常细胞在不同阶段获得这些能力。Hanahan 和 Weinberg(2011)提出,这种能力的获取得益于以下两个促成特征(enabling characteristics):
  • 基因组不稳定性和突变(genome instability and mutation):基因组不稳定性会产生突变(见 2.1 节),包括染色体异常(见 2.8 节),从而为癌细胞提供选择优势。这一促成特征与标志能力的获得有因果关系。
  • 肿瘤促进性炎症(tumour-promoting inflammation):免疫细胞通常预期会消除体内异常细胞。然而,炎症反应具有增强肿瘤发生和进展的矛盾效应。实际上,炎症可以通过为肿瘤微环境提供生物活性分子(例如肿瘤细胞和血管的生长因子、促进侵袭的蛋白酶)来支持多种标志能力。
第 8.1.6 和 8.1.7 节将回顾已有的数学模型。
总而言之,Hanahan 和 Weinberg(2000, 2011)提出了八种不同的标志特征和两种促成特征,几乎在所有癌症中都有所体现。第 8 章将描述基于系统生物学方法处理这些标志特征的不同数学模型。

2.8 癌症中的染色体畸变 (Chromosome aberrations in cancer)

图 2.11 中描述的基因组不稳定性和突变标志特征导致了染色体畸变。本节详细介绍了这些畸变,特别是使用高通量技术(详见 第 3 章)所开展的研究。

2.8.1 癌症中的异常核型 (Abnormal karyotype in cancer)

染色体的正常配置通常被称为整倍性 (euploid) 核型状态。整倍性意味着每一对染色体成对出现且结构正常。偏离整倍性核型的情况称为**非整倍性 (aneuploidy)**,在许多癌症中观察到(参见 图 2.12)。通常,这种非整倍性仅是癌细胞中逐渐积累的突变引起的一般性混乱的结果。确实,当突变累积到临界数量时,由于 DNA 修复和细胞周期检查点的缺陷,细胞无法正确执行染色体的复制和分离,导致基因组不稳定 (Aguilera and Gómez-González, 2008)。这种不稳定性出现在核苷酸(即 DNA 序列的不完全复制)和/或染色体水平(即染色体数量不正确)。因此,子细胞具有受扰的功能性。
image-20241105054741710
图 2.12 T47D 乳腺癌细胞系的核型 (Karyotype of the T47D breast cancer cell line)
该核型显示该细胞系由于基因组不稳定性经历了多种染色体畸变。字母 t 表示括号内的两条染色体之间的易位。图中仅标示了一些畸变。图 3.8 和 图 3.15 展示了高通量技术的应用,以表征该细胞系内的染色体畸变。数据来源于 Roshcke et al. (2003),网址:http://www.ncbi.nlm.nih.gov/sky。(见彩图插页)
1914 年,Theodor Boveri 提出了癌细胞来源于染色体内不可修复缺陷细胞的假设。随着基因组重排和癌症遗传学的新发现 (Satzinger, 2008),这一假设在最近几十年被重新审视。重排发生是由于 DNA 的断裂和融合,导致子细胞的异常核型。在神经母细胞瘤中,研究表明这些断裂更倾向于发生在 S 期早期复制区域 (Janoueix-Lerosey et al., 2005)。
image-20241105054007915
图 2.13 染色体畸变的示意图 (Schematic illustration of chromosomal aberrations)
(A) 常见的畸变包括增益、丢失和易位。扩增可能表现为双微粒、具有均质染色区域 (HSR) 的染色体,或扩增的 DNA 分布在多个位置。图中用灰色和白色表示两种不同的染色体。
(B) 没有 DNA 拷贝数变化的 LOH 使染色体表面上保持完整,但整个染色体或染色体的一部分由于来自一个亲本的遗传来源丢失。灰色染色体来自母亲 (M),白色染色体来自父亲 (F)。
图片改编自 Albertson et al. (2003)。
产生异常核型的典型染色体畸变在 图 2.13 中进行了说明,详解如下:
  • *多倍体 (polyploidy):每条染色体以 p 份存在,其中 p>2表示倍性(p=2 为正常倍性)。
  • 非整倍性 (aneuploidy):部分染色体有额外或缺失的副本。
  • 易位 (translocation):由同源或非同源染色体之间部分交换引起的染色体异常。易位可以是相互性的(或平衡的,即两端交换)或非相互性的(或不平衡的,即交换中获得或丢失了一端)。
  • 扩增 (amplification):染色体的某一部分(如基因或一组几个连续的基因)以大量拷贝存在(从 4 到超过 50 个拷贝)。这些多个拷贝要么被插入到几乎连续的均匀染色区域 (HSR) 中,要么插入到基因组中,形成无着丝粒的片段(双微粒)。
以下术语还可用于描述染色体某个特定区域的拷贝数:**缺失 (deletion)(不再存在任何拷贝)、单体 (monosomy)(存在一个拷贝)、三体 (trisomy)(存在三个拷贝)、四体 (tetrasomy)**(存在四个拷贝)等。这些重排可以是完全的(即涉及整个染色体)或部分的(即仅涉及染色体的某一区域)。
某些染色体畸变不会产生异常核型,并且染色体以正常的两份副本存在(见 图 2.13B)。在正常基因组中,染色体是杂合的:一份拷贝来自父亲,另一份来自母亲。在癌症中,有些染色体来自相同的亲本来源。在这种情况下,两份染色体是相同的,因此这些染色体是**纯合的 (homozygote)。这种现象称为无拷贝数变化的 LOH (Loss of Heterozygosity)**,因为一个亲本染色体(或仅一部分)在第一个事件中丢失,而缺失的染色体(或仅缺失的部分)已从剩余的亲本染色体复制。
突变和染色体畸变在肿瘤进展过程中累计,历时数年。然而,Stephens 等人 (2011) 表明,单次细胞灾难性事件可能会同时导致数十到数百个基因组重排。在这种称为 染色体破裂 (chromothripsis) 的灾难性事件中,DNA 被分割,随后的修复并不精确,导致染色体畸变及染色体区域的丢失(参见 图 2.14)。这种现象在至少 2%-3% 的癌症中可能发生。
image-20241105054601609
图 2.14 染色体断裂 (Chromothripsis)
在一次灾难性事件中,DNA 被分裂。一些片段随后被随机排序并合并,而其他片段则丢失。左上角的图显示了预期的 DNA 拷贝数分布(DNA 拷贝数分布在 图 3.8 中解释)。图片改编自 Tubio 和 Estivill (2011)。

2.8.2 染色体畸变对癌症关键基因的影响 (Impact of chromosome aberrations on cancer-critical genes)

为什么这些染色体畸变在癌症中如此重要?在许多情况下,它们会引起肿瘤进展,因为它们可以直接影响癌症相关的关键基因。更普遍地说,致癌基因 (oncogenes) 常见于基因增益或扩增区域,或融合基因中,而肿瘤抑制基因 (tumour suppressor genes) 常见于基因丢失区域或无 DNA 拷贝数变化的 LOH 区域。因此,对染色体畸变的特征化有助于发现新的癌症关键基因候选者。

2.9 结论 (Conclusion)

在本章中,我们展示了多步骤事件的累积如何将正常细胞转变为癌细胞,导致基因调控和信号传导机制的缺陷。在肿瘤进展过程中,会出现许多改变,包括点突变、表观遗传修饰、染色体畸变等。这些改变无论其性质如何,都可以根据其对癌症发展的因果关系分为驱动因子 (drivers) 或乘客因子 (passengers) (Stratton et al., 2009)。
驱动因子改变与癌症的发展有因果关系。这种改变已通过达尔文选择正向选择,因为它赋予了癌细胞在肿瘤进展过程中的某一阶段的生长优势。乘客改变未被选择,也未赋予生长优势,因此未对肿瘤进展作出贡献。乘客改变仅仅是在癌症的生长过程中偶然发生的。在癌症中观察到的各种改变中,只有少数是驱动因子。因此,在癌症发展的道路上区分驱动因子和乘客因子是至关重要的。
癌症中分子改变的全基因组特征化,尤其是利用高通量技术(参见 第 3 章),结合计算系统生物学方法(参见 第 4 章 至 第 11 章),为驱动因子的发现及其在癌症相关细胞过程中的因果关系理解提供了见解。这些方法不仅有助于新生物标志物 (biomarkers) 的识别,以帮助临床医生做出预后和预测决策,还可以帮助发现新的药物靶点并更好地理解肿瘤进展机制。

练习

  • 使用图 2.13 中列出的可能的染色体畸变,列举出在图 2.12 提供的 T47D 乳腺癌细胞系的核型中可以观察到的畸变。
  • 在一个细胞中,观察到异常的核型,显示出一个均质染色区域 (HSR)(参见图 2.13)。进一步的研究表明,miRNA miR-21 存在于扩增区域中。肿瘤抑制基因 PTEN 是 miR-21 的靶基因。该扩增对 PTEN 表达的影响及其对细胞的作用可能是什么?

要点

  • 癌症是由生物体一生中突变的积累引起的。
  • 癌症是一种遗传性疾病,其原因是肿瘤抑制基因和致癌基因表达的失调。
  • 癌症是一种网络性疾病。
  • 肿瘤是一个复杂且异质的系统,包括不同类型的癌细胞和正常细胞。
  • 肿瘤微环境在肿瘤进展中起着重要作用。
  • 肿瘤具有称为标志特征的共同特性。
  • 在癌细胞中,异常核型非常常见。


生信菜鸟团
生信菜鸟团荣誉归来,让所有想分析生物信息学数据的小伙伴找到归属,你值得拥有!
 最新文章