摘要
背景
遗传性疾病通常表现为胎儿或儿童发育异常。拷贝数变异(CNV)代表了此类疾病的重要遗传机制。尽管它们很重要,但临床外显子组测序(CES)在检测CNV(尤其是小CNV)方面的有效性仍不完全清楚。我们旨在评估在大量临床队列中使用CES检测大CNV和小CNV,包括亲本-后代家系和仅先证者分析。
方法
我们对2018年至2021年收集的2428个家庭的CES数据进行了回顾性分析。检测到的CNV分为大或小,并采用各种验证技术,包括染色体微阵列(CMA)、多重连接依赖性探针扩增测定(MLPA)和/或基于PCR的方法,用于交叉验证。结果我们的CNV发现在154例病例中发现了171个CNV,总体检出率为6.3%。对103例病例中的113例CNV进行了验证,以评估CES的可靠性。CES与其他验证方法之间的总体一致性为88.49%(100/113)。具体来说,CES在检测大CNV方面表现出完整的包容性。然而,对于小CNV,缺失的一致性率为81.08%(30/37),重复的一致性为73.91%(17/23)。
结论
CES在CNV检测中表现出较高的灵敏度和可靠性。在发育异常(尤其是胎儿结构异常)的情况下,它成为临床CNV检测的一种经济且可靠的选择。
关键词
拷贝数变异,染色体微阵列,外显子组测序
简介
智力障碍、精神分裂症、脑瘫和各种其他遗传疾病受CNV的显着影响。许多研究强调了CNV在各种遗传疾病中的关键作用,尤其是胎儿结构异常和儿科中神经疾病。有证据表明,大约6%的具有临床意义的染色体不规则关系表现在具有结构异常的胎儿中,即使是核型正常的胎儿。无论是独立发生还是与单核苷酸变异(SNV)一起发生,CNV,尤其是较小的CNV,都会对疾病的遗传景观做出重大贡献。然而,缺乏同时检测新CNV和SNV的有效方法,这在遗传诊断中构成了重大挑战。虽然外显子组测序(ES)已成为CMA阴性结果后的第二选择,但其顺序方法与临床要求及时且具有成本效益的解决方案相矛盾。近年来,外显子组测序为跨编码区的CNV和检测小于1000bp的CNV提供了有价值的见解,使ES成为CNV检测的有前途的替代方案。研究人员越来越喜欢使用全外显子测序(WES)进行CNV检测,认识到分析下一代测序(NGS)原始数据的优势。2022年,Testard等人在分析了2418例病例后得出结论,WES可以作为CNV检测的主要测试。然而,这项研究采用了各种ES情景,并且缺乏对每个已识别的CNV的系统验证。尽管WES在CNV鉴定方面具有潜力,但由于使用的CNV调用工具和算法的不同,许多关于ES中CNV检测率的报告缺乏准确性评估。尽管CMA是一种初始的CNV检测方法,但它在检测小CNV和低嵌合度水平方面的局限性是显而易见的。越来越多的证据支持WES在CNV鉴定方面的潜力。利用WES的CNV和SNV同步检测可以彻底改变遗传疾病诊断,大幅降低成本和周转时间。因此,我们的研究旨在通过不同的验证方法严格评估CES中临床相关的CNV检测,确保其可靠性和临床实用性。
结果
CES检测到的CNV及其分布CES共鉴定出171例临床相关CNV,进一步分为缺失和重复。然后根据大小(>100kb和≤100kb;>500kb和≤500kb)对这些CNV进行亚组分组,得到117个缺失(32个CNV>100kb,85个CNV≤100kb)和54个重复(23个CNV>500kb,31个CNV≤500kb)(图1,增补4)。这些CNV分布在整个基因组中,但3、8、14、21和Y染色体除外(图2A)。在CNV中,16p占总数的40.69%(70个CNV),其中包括16p13.3中的54个CNV、16p13.11中的5个CNV和16p11.2中的11个CNV(补充4)。除了这些突出的热点外,还发现了31个复发性CNV区域和32个罕见的CNV区域。
图2
CNV验证
在为每种类型的CNV选择代表性病例后,共验证了103例(113个CNV)(补充5)。总共有31个经CMA验证的CNV(9个缺失>100kb,2个缺失≤100kb,13个复制>500kb,7个重复≤500kb),49个经拷贝数变异测序(CNV-seq)验证的CNV(27个缺失>100kb,5个缺失≤100kb,12个重复>500kb,以及5个重复≤500kb),经MLPA验证的10个CNV(8个缺失≤100kb,2个重复≤500kb)和40个CNV(1个缺失>100kb,26个缺失≤100kb,13个重复≤500kb)(图2B)。在所有经过验证的CNV中,94例使用单一方法确认,18例使用两种方法确认,1例使用三种方法确认。CES发现的大于100kb(缺失)或500kb(重复)的CNV均与CMA或CNV-Seq一致,导致阳性预测值(PPV)为100%。在小CNV中,37个缺失中有30个(81.08%)和23个重复中的17个(73.91%)符合经过验证的方法(表1)。
图1
这里有13个实例中的13个小CNV(病例31、36、39、40、47、56、57、84、85、87、90、95和102),经过验证不匹配。这些CNV是0.4kb到81kb不等的缺失,包含单个基因的多个外显子(例如,KNL1(NM_170589)的外显子24-25和CREBBP(NM_004380)的外显子21-22)和4.4kb到126kb的重复,涉及一个基因的多个外显子(例如,EP300的外显子1-6(NM_001429),STIL基因的外显子14-16(NM_001282939)和KMT2C基因的外显子9-59(NM_170606))或多个基因(11q23.3)。我们对结果无法验证的CES-CNV影响病例进行了彻底随访。在病例36中,确定了母系等位基因中外显子13-17的复合杂合缺失,并结合了PLA2G6(NM_003560)中c.1547C>T致病性变异。先证者在4岁时通过头部MRI表现出步态问题、发育倒退(DQ46.6)和枕骨池异常,与PLA2G6基因相关的婴儿型的神经轴索营养不良1型(OMIM#256600)一致,表明单一的CNV可能是真实的。病例56和57是双胞胎,KNL1(NM_170589)外显子24-25可能存在致病性缺失,并与父系c.4914_4915重复复合。此外,病例56在16p11.2区域进一步缺失了398kb。不幸的是,其中一对双胞胎(病例57)在出生后不久因出生低体重而死亡;然而,对存活的婴儿进行了随访,直到3岁零7个月,表现出正常的语言和智力发育,没有任何临床相关的表型。没有明显的表型在对2例患者(病例84和85)进行随访期间,有11q23.3重复。2例(病例90和95)发现KMT2C(NM_170606)重复,也存在于其母亲中,但在随访过程中均未抑制任何表型。在两例(病例39和40)中鉴定出完整的NPHP1(NM_000272)杂合缺失,但未观察到任何表现。在病例102中,发现了跨越EP300外显子1-6的de novo重复(NM_001429)以及22q12.2q12.3(>3.07Mb)的缺失。患者的表型与22q12.2缺失综合征的特征一致;然而,未检测到与EP300相关的相应表型。病例31的IGLL1(NM_020070)完全杂合缺失,而病例88的16p13.3(>4.4kb)重复,均未表现出与这些遗传异常相关的明显临床表现。病例47有CREBBP(NM_004380)外显子21-22的de novo缺失,由于单侧肢体缺失和马蹄足畸形,胎儿在妊娠期被终止。根据现有证据无法确定与CREBBP基因异常相关的确切临床表型。根据目前的技术和临床数据,这些不一致的病例所携带的CNV真实性无法准确判断,需要进一步研究。
除了上面提到的这些不一致的情况外,我们还遇到了一个有趣的案例(案例46),其中CES表明HBA2的外显子3缺失(NM_000517)(图3A)。后续验证使用MLPA作为主要方法揭示了更大程度的缺失(图3B)。根据一致性标准,这一结果与CES的调查结果不符。然后使用定制设计的液相芯片进行与地中海贫血相关的基因检测,并检测HBA2(NM_000517)和上游HBA1(NM_000558.5)(-α3.7)的部分缺失(图3C)。由于同源序列的存在, MLPA在识别HBA1/2基因方面缺乏准确性,当四个拷贝中只有一个被删除时,检测外显子3的信号减少。案例103涉及一个家庭,其中两名女孩患有智障。CES表明先证者(II-1)中TRIO基因(NM_007118)中的外显子21-33从头分离。随后通过Gap-PCR和Sanger测序(34,422bp缺失)确定断点。通过GapPCR在先证者的妹妹和他们的母亲中检测到CNV(图4)。在重新检查NGS数据后,在母体中发现嵌合缺失。
图3
讨论
在这项研究中,我们从总共2428个家系中发现了154个无关病例中的171个具有临床意义的CNV。通过基于捕获的CES方法检测T这些CNV,利用基因组分析工具包(GATK)算法和ClinCNV。临床相关CNV的患病率确定为6.3%(154/2428),与之前使用WES或CMA的研究结果一致。出乎意料的是,我们观察到了CNV热点,如16p13.3、16p11.2和22q11.21。此外,这些CNV分布在整个基因组中,很少有染色体显示未检测到的改变,表明在我们的队列中具有强大的临床代表性。在我们的研究中,3、8、14、21和Y染色体上没有CNV可能是因为它们的发病率低以及与智力障碍有关。然而,由于我们队列中的智力障碍病例有限,因此进一步探索这些关联具有挑战性。此外,某些CNV,例如Y染色体上的AZF缺失被排除在我们的研究之外,因为它们主要与不孕症有关。
CES与其他CNV检测方法之间的总体一致性为88.49%。随着包含复发性低外显率CNV或隐性CNV携带事件[16p13.3缺失(n=50)、16p11.2缺失(n=9)、1q21.3重复(n=3)、SMN1缺失(n=4)、DMD缺失(n=4)、NPHP1重复(n=8)],CES发出的CNV调用的可靠性提高到92.39%。我们CNV检测的这一一致性率与Petr Danecek等人在多中心研究中报告的外显子分辨率CMA检测率(89%)相当。此外,我们的研究受益于更大的样本量,与早期队列较小的类似研究相比,最大限度地减少了偏倚。值得注意的是,我们采用了一系列验证技术来验证检测到的CNV,从而提高了基于CES的CNV鉴定的可靠性。因此,本研究代表了对基于捕获的ES衍生的CNV可靠性的首次系统评估。
所有53个大于100kb(缺失)或500kb(重复)的CNV均通过CMA或CNV-seq确认,肯定了CES检测到的较大CNV的可信度(表1)。此外,78.33%(47/60)的小CNV通过其他方法得到证实,而其余21.67%(13/60)由于位于高度同源的基因组区域,例如IGLL1(NM_020070)基因的外显子2-3,增加了短读长测序数据中比对错误的可能性。
我们的研究强调了通过CES鉴定的CNV的真实性,特别是对于较大的CNV,这对遗传实验室科学家和临床医生来说很重要。为确保最佳疗效,应在临床环境中采用验证策略的组合,考虑成本、周转时间以及CNV大小和位置等因素。建议使用CMA或CNV-seq对较大的CNV进行验证,而较小的CNV可以根据可用资源和CNV特征使用灵活的方法进行验证。但是,使用CES检测CNV受到限制。首先,分析仅限于与孟德尔疾病相关的编码区。此外,具有同源序列的基因组区域的存在在读取映射和CNV检出中引入了偏差。虽然CMA仍然是对大型CNV进行验证的金标准,但包括MLPA、基于PCR的方法、定制设计的液相芯片和qPCR可用于验证小CNV。
例如,在α地中海贫血的情况下,HBA1(NM_000558.5)和HBA2(NM_000517)之间的高度同源序列对准确鉴定构成了挑战。常见的3.7kb缺失导致HBA2的外显子1和2(NM_000517)与HBA1的外显子3(NM_000558.5)融合。他的缺失消除了外显子3的一个实例,这是在HBA1/2基因位点内表现出共有序列的四个拷贝之一。这种现象可能解释了CES表明HBA2中包含外显子3与不确定的MLPA结果之间的差异,尽管病例46暗示了实质性缺失。此外,用于地中海贫血基因检测的定制液相芯片表明基因型为-α3.7/αα。尽管MLPA结果与定制设计的液相芯片的结果不一致,但CES始终表明缺失的风险,使用替代方法进行交叉验证,从而提供有价值的见解。因此,由于其信息指示,缺失被归类为内聚亚组,如表1所示。
该方法不仅具有成本效益和节省时间,而且满足“准确、及时”诊断的临床要求,为建立临床路径提供了基准。对于其他小CNV,可以根据CNV大小、基因组位置灵活选择验证方案。应该承认我们研究的几个局限性,包括来自单个中心的回顾性数据、缺乏长期随访数据,尤其是对于未经证实的CNV,以及关于嵌合体的案例研究不足。需要更广泛的多中心研究和更多案例来进一步完善我们的验证程序。
结论
CES准确地为遗传病病例提供了CNV信息,与CMA相比具有明显的优势,尤其是在检测小CNV方面。因此,它是临床实践中CNV检测的一种非常有效的方法。
广告