BRCA1 7号外显子部分缺失是个突变热点但是NGS和MLPA都漏了

科技   2024-12-24 06:59   上海  

多重连接依赖探针扩增(MLPA)已在BRCA1/BRCA2基因的诊断中应用超过20年,已知涉及BRCA1的缺失/重复占诊断基因突变的相当一部分。我们描述了一例来自100,000基因组计划(100kGP)的家族,该家族具有显著的乳腺癌/卵巢癌家族史,并携带有178 bp的BRCA1缺失。由于其位置,这一缺失对于下一代测序(NGS)基因面板和MLPA检测来说是隐匿的。对变异数据库的进一步分析表明,这一变异是尼泊尔奠基者变异,凸显了疾病单倍型附近的变异可能导致人类基因组变异学会(HGVS)命名法的不一致。

该家系的先证者(现已去世)被诊断为卵巢癌,而她的患病表妹先后被诊断为乳腺癌和卵巢癌。该家族具有尼泊尔血统,且有阳性家族史,上一代中有三名女性被诊断为早发乳腺癌,诊断年龄为41-50岁(在线补充图S1)。之前的遗传检测包括SALSA MLPA Probemix BRCA1-P002-C1(MRC-Holland)和使用Roche 454 GS-FLX平台进行的NGS检测,最小覆盖度为30×。这些检测在2011年进行,未发现任何合理的诊断变异。因此,先证者和她的表妹于2016年中期被招募到100kGP项目中。

100kGP是一个覆盖全英国的研究,旨在展示基因组测序(GS)在多种罕见疾病和癌症患者中的应用价值。使用了TruSeq PCR-free高通量试剂盒,并从EDTA血液管中提取DNA。GS在Illumina HiSeqX平台上进行,采用150bp双端测序。比对和变异调用使用了North Star Version 4 Workflow(NSV4, V.2.6.53.23)和GRCh38参考基因组。对患病先证者及其受影响的家庭成员进行GS测序,平均覆盖度分别为40×和52×。测序和生物信息学预处理由Genomics England集中进行。主要分析于2019年中期进行,集中于与家族性乳腺癌相关的10个基因(PanelApp V.1.13:ATM、BRCA1、BRCA2、CHEK2、PALB2、PTEN、RAD51C、RAD51D、STK11、TP53),但未能发现可能的致病变异。

结构变异(SVs)的检测使用了MantaCanvas算法。在本研究中,结合SV调用结果,通过基于71,408名个体的聚合数据确定的等位基因频率优先考虑SV变异的筛选。测序比对结果使用IGV v2.15.4进行查看。Manta检测到一个位于BRCA1的178bp缺失(NC_000017.11:g.43099608_43099786del),该缺失在两名受影响个体中共享,但在其他任何100kGP参与者中均未发现。由于缺失的大小,Canvas未能在此位点检测到任何拷贝数变异(CNV),而一个4.2Mb CanvasREF调用(chr17:41,276,119–45,511,623)覆盖了BRCA1的整个区域。该缺失仅去除了BRCA1外显子7的12bp,因此不会影响邻近的MLPA探针结合位点(图1)。结合Canvas的正常结果,这也解释了为何该缺失之前未被检测到。对最新版本BRCA1 MLPA面板的探针设计进行回顾表明,这一缺失对于P087和其他新款试剂盒也是隐匿的(Lillit Atanesyan,个人通讯,2024年)。单倍型分析(在线补充表S1,图S2)识别出一个邻近的编码性单核苷酸变异(SNV),NM_005899.5(NBR1):c.1244T>C,p.Met415Thr,该变异在整个100kGP中也仅为该家族特有,且可能作为标记性SNV使用。

为了优化PCR引物设计,我们评估了周围的基因组特征,并将ClinVar的CNV数据轨道加载到我们的UCSC基因组浏览器会话中(https://genome.ucsc.edu/s/AlistairP/BRCA1_del_final)。对该区域ClinVar CNV的回顾发现,2019年至2023年间提交了三种相似的缺失(见表1)。尽管这三种缺失似乎共享相同的远端断点,但近端断点有所不同,且2/3的注释包含了1或52个碱基对的插入序列。通过对这些注释的仔细审查,并结合100kGP的读取比对数据,表明这三条ClinVar条目实际上表示相同的变异。这一解释通过与提交实验室的讨论得到了证实。尽管这三条HGVS注释均正确,但不明确的是T的插入或者与该变异共存的附近变异(即,位于同一疾病单倍型上)是否也被捕获。NM_007294.4:c.536_547+166delinsT注释包括T的插入,但在IGV中显示为相邻的SNV(见图1)。相比之下,c.536_547+209delinsTCACCTTGAAGAATCTTACTTTAAAAAGGGAGCAAAAGAGGCCAGGCATGGT则同时捕获了SNV和一个附近的8个碱基对重复序列。尽管这些信息在设计PCR引物时可能有用,但最近向HGVS委员会提出的建议(https://hgvs-nomenclature.org/stable/consultation/SVD-WG010/)建议,“两个相距少于两个碱基对的变异应描述为一个单一的‘delins’变异”。因此,SV应该拆分成两个变异,即c.[536_547+166delinsT;547+213_547+220dup]。

使用SpliceAI进行的计算机模拟分析预测了外显子跳跃,并且将附近的变异包含在输入的HGVS字符串中对得分的影响有限(表1)。外显子7的跳跃(r.442_547del)将导致移码突变p.(Gln148Aspfs*51),因此该等位基因可能具有功能性危害。该缺失-插入变异在认证实验室中进行了验证,并被分类为致病性(PVS1和PM2)。

近年来,DNA测序和芯片技术取得了快速进展。然而,对于大小在50–1000bp范围内的变异,仍然存在盲点,如此处描述的缺失变异。这些变异太大,无法通过小变异调用算法识别(比如GATK),但又太小,无法通过芯片检测到。为了解决这一不足,临床检测实验室通常采用MLPA技术,其中探针对可以根据需要定制,针对约40–50个基因位点进行检测。此处描述的178bp缺失突显了部分外显子缺失可能无法被检测到,即使MLPA探针位于同一外显子内。使用基因组测序(GS)数据时,需要适当的算法来检测此类大小的缺失。在基因组测序数据生成后,该变异花费了约3.5年的时间才被发现,延长了该家族的诊断历程,并且延误了对高危家族成员进行级联筛查的机会。

临床变异数据库的查询表明,该奠基者缺失变异源自尼泊尔(表1)。尽管在2022年关于尼泊尔人群中奠基者变异的研究中未能识别该缺失变异,然而该研究使用的方法不太可能识别出该缺失变异,并且仍有31个乳腺癌未解病例的家庭可供筛查。我们预期,使用适当的方法学对这些及其他该族裔家庭进行检测,可能会发现更多携带该隐匿性变异的家庭。

通常,如果对同一变异使用不同的注释,可能会错过其与疾病的关联,这会影响变异的优先级排序。在这个特定案例中,我们注意到ClinVar使用的星级评分系统可能导致178bp缺失变异在某些分析管道中过滤掉。因此,数据库提交者和编辑者在决定是否将邻近的顺式变异纳入HGVS标注时,应该特别注意先前报告的重叠结构变异。相反,使用过时HGVS标注的旧提交记录理应与较新的记录合并。

游侠点评

正如文章中所言,几十bp到300bp左右的缺失与重复是目前基因检测的盲区,如果算法不覆盖这样的变异就会导致漏检,最近游侠开发了基于WES和Panel的SV分析流程,前期测试效果非常不错,像文章中的缺失不会遗漏,如果你有这样的阳性病例欢迎测试。


基因检测与解读
介绍基因检测新进展,探讨基因数据分析流程与方法,分享罕见病故事,科普基因知识,阴性报告重分析
 最新文章