家族性皮质肌阵挛性震颤癫痫(FCMTE)是一种常染色体显性遗传病,特征是皮质肌阵挛震颤和癫痫。肌阵挛震颤发病年龄从10岁到60岁不等,平均30岁。至少有一半的受累者发生癫痫,主要是全身强直阵挛发作,伴随震颤或晚年出现震颤。肌阵挛和癫痫发作因光刺激、酒精、睡眠剥夺或情绪紧张而加重。震颤往往会在老年恶化,并伴随步态不稳和行走困难。在1999~2013年位于chr2,3,5和8的4个基因座相继被找出,但近20年来对候选区域进行拓展测序仍旧没有找到FAME的致病基因。直到2018年,罗巍教授团队发现【Brain】SAMD12基因的内含子五核苷酸TTTCA重复插入导致家族性皮质肌阵挛震颤伴1型癫痫及日本东京大学团队【Nature Genetics】WGS和三代测序技术鉴定良性成人家族性肌阵挛性癫痫中内含子TTTCA和TTTTA重复序列的研究发现,从而确定SAMD12基因内含子中的动态突变是BAFME(FAME1)的病因,SAMD12的动态突变是由TTTCA和TTTTA组成。在一个没有SAMD12动态突变的家系和一个没有SAMD12动态突变的散发病例中,TNRC6A和 RAPGEF2基因发现了同样的动态突变。这提示还有其他的动态突变造成FAME。在chr2的STARD7,chr3的YEATS2和chr5的MARCHF6也发现了相似的TTTCA/TTTTA动态突变。
东亚和南亚的FCMTE1谱系已经报道了一个共同的祖先创始人,通过共享的单倍型区域,初步估计(TTTCA)exp插入发生在约17000年前,并遗传给后代。然而,在之前的研究中,复杂的构型变换还没有得到充分考虑,如(TTTTA)exp(TTTGA)exp,(TTTTA)n(TTTCA)exp(TTTTA)exp,(TTTTA)exp(TTTGA)exp(TTTCA)exp。
此外,在3.4–5.9%的对照组中观察到的单纯的非致病性等位基因(TTTTA)未包括在单倍型分析中。
针对以上科学问题,2024年2月28日,针对SAMD12基因座五核苷酸重复序列扩增的起源和进化,浙江大学附属第二医院的罗巍教授、岑志栋教授团队最新研究成果以“Origin and evolution of pentanucleotide repeat expansions at the familial cortical myoclonic tremor with epilepsy type1 - SAMD12 locus”为题,发表在《European Journal Of Human Genetics》杂志。
在这项研究中团队通过单倍型分析和靶向长读测序,以探索在FCMTE1–SAMD12基因座检测到的所有重复扩增的起源和进化场景路径。
1. 纳入样本:来自21个不同谱系的77名FCMTE1患者,107名未受影响的对照组(包括61名与FCMTE1患者结婚的对照组和46名无关的对照组)。
2.单倍型分析:Illumina®HumanOmniZhongHua-8芯片分型,选择区间Chr8:118808566-119556430(GRCh37/hg19)内的SNPs进行单倍型分析。
3. 靶向长读长测序:使用下述引物对基因组DNA进行长区域PCR(LR-PCR)扩增,并在PacBio RS II(SMRT)测序仪上进行长读测序。
1. 纯(TTTTA)exp和(TTTTA)exp(TTTCA)exp密切相关
在先前报道的谱系A的一个分支中,单倍型分析显示,患者IV:5的SAMD12周围有6Mb的纯合区(PA-IV:5,图1A),但家族史中没有报告血缘关系的证据。通过靶向长读测序发现两个等位基因的不同重复结构,一个含有致病性(TTTTA)exp(TTTCA)exp,另一个含有非致病性纯(TTTTA)exp。单体型分析中提示长段同源的基因型支持纯(TTTTA)exp和(TTTTTA)exp(TTTCA)exp之间最近发生了构型转换。另一方面,团队在来自未受影响对照的214个等位基因中发现了12个独立的纯(TTTT)exp等位基因。值得注意的是,与来自无关地区的对照组相比,从相同地理区域招募的对照组(如FCMTE1患者的配偶)的纯(TTTTA)exp检测率显著更高(9.02% vs. 1.09%,p=2.81e−03)。这表明纯(TTTTA)exp等位基因和(TTTTA-exp(TTTCA)exp等位基因之间具有地理亲和力。
图1A 连锁分析定位致病性等位基因
2. FCMTE1–SAMD12基因座上具有不同配置的所有PRE的奠基者效应
使用来自FCMTE1家族的16个未报告和11个已报告的(TTTTA)exp(TTTCA)exp等位基因,以及来自独立未受影响携带者的12个纯(TTTTA)exp等位基因进行单倍型分析,分析结果表明不仅(TTTTA)exp(TTTCA)exp等位基因,而且纯(TTTT)exp等位基因均共享84kb的创始单倍型(图1B)。39个等位基因的最近共同祖先(MRCA),估计可以追溯到大约586代(95%CI:289–906)或大约14650年(假设每代25年)。根据共享区间,构建了系统发育树(图1B)。观察到两个主要簇,由纯(TTTTA)exp等位基因和(TTTTA)exp(TTTCA)exp等位基因组成。SNP标记rs4876828可以区分簇1和簇2,分别对应于C和T。据估计,这两个集群的MRCA可以追溯到373代(95%CI:173–825)和368代(95%CI:215–636)以前。此外,具有两种替代重复配置的等位基因,(TTTTA)n(TTTCA)exp(TTTTA)exp和(TTTTA)exp(TTTGA)exp,在可用区间内也与H和I谱系的(TTTTA)exp等位基因共享相同的单倍型(图1B)。图1B 基于不同等位基因的发育树构建
上述单倍型分析表明,不同重复结构之间的转换在进化史上经常发生。
根据报告的地理信息,这两个集群呈现出不同的分布模式(图2)。来自聚类1的等位基因分布更广泛,不仅在中国,而且延伸到日本和泰国。聚类2的等位基因主要分布在中国东部、印度和斯里兰卡。扩增等位基因的地理分布表明,华北地区可能是具有不同单倍型和四种不同构型的纯TTTTA等位基因聚集的地理起源地。
图2 基于等位基因单倍体型的地理起源地推测
4.(TTTTA)exp(TTTCA)exp可能通过从纯(TTTTA)exp插入长片段(TTTCA)exp生成
由于生殖系水平上的重复结构异质性可能与体细胞水平上的异质性一致,因此采用靶向长读测序来探索不同重复结构之间的转换是如何在体细胞水平发生的。10个纯(TTTTA)exp等位基因的平均深度为2879±2399。团队在一个具有6158个reads的纯(TTTTA)exp中发现了3个reads,在(TTTTA)exp之后,3'端具有长片段(TTTCA)exp(31,183和197个重复)(图3)。这三个reads被推测是由体细胞变体产生的新reads,这支持了通过长片段(TTTCA)exp插入发生转化的假设场景。另一种假设情况是,(TTTCA)exp是由纯(TTTTA)exp中的T>C取代产生的,总的来说,在(TTTTA)exp中,4914个reads(17.10%)含有TTTCA,然而,TTTTA基序中其他三个T位点的T>C取代也以相似的速率观察到(p=0.0695)。因此,团队提出这些T>C替换可能是误读,与(TTTCA)exp生成无关。
1. 本研究团队通过单倍型分析和靶向长读测序,发现奠基者效应在不同的高度重复中被广泛观察。团队观察到非致病性纯(TTTTA)exp和致病性(TTTTA)exp(TTTCA)exp之间的奠基者效应,认为构型转变是由于长(TTTCA)exp片段插入而发生。
2. 本文中发现先前推测(TTTCA)exp插入发生在大约17000年前,且所有FCMTE1患者的祖先可能是纯(TTTTA)表达的个体。致病性(TTTCA)表达或(TTTGA)表达插入可能发生在不同的进化阶段和时间点,人群中的(TTTTA)exp携带者可能是大量的预突变,有成为(TTTTA)exp(TTTCA)exp患者的风险。3. 本研究中发现的(TTTCA)exp序列在参考人类基因组中没有注释,但团队已经鉴定出(TTTCA)exp序列后面跟着Alu元件(Chr12:1118133165-118133264,GRCh38/hg38)。Alu元件几乎位于所有报道的疾病相关PREs的侧翼序列,推测Alu元件的随机重组可能发生在FCMTE–SAMD12基因座,致病性(TTTTA)exp(TTTCA)exp就是从该基因座衍生出来的。因此,Alu元件的体细胞重组在人类基因组中广泛存在,并且逆转录元件重组与神经退行性疾病之间存在联系。总之,本研究探索了重复扩增序列在FCMTE1–SAMD12基因座的起源和进化、场景、路径,这些重复序列的演进和规律对于研究罕见遗传病的致病机制具有指导意义,更加增强了人类对于基因组的结构和规律的深入洞见和理解。
Driving innovation for better life!