冠状动脉疾病(CAD)是全球主要的致病和致死原因之一。CAD具有显著的遗传成分,遗传率估计在40-60%之间。大规模全基因组关联研究(GWAS)已经在超过100万参与者中确定了321个与动脉粥样硬化相关的基因。大多数易感位点由位于非编码区的常见单核苷酸变体(SNV)驱动,这些变体的次要等位基因频率(MAF)大于0.05,因此确定潜在的致病基因较为困难。相较之下,罕见(MAF ≤0.01)和超罕见(MAF ≤0.0001)的错义或蛋白质截短变异(PTV)对蛋白质功能有直接影响,能够揭示基因在疾病病理生理学中的作用,并提示潜在的治疗靶点。利用测序数据进行的稀有变异关联研究,可以探索人类基因组中所有蛋白质编码基因的稀有和超稀有编码变异。至今,针对CAD的大规模外显子组测序研究相对较少,在发现罕见的CAD编码变异方面取得的成果有限。冠状动脉疾病自然存在于一个谱系中,因为狭窄和斑块成分的变化导致心肌梗死风险和死亡率的差异。这一系列疾病由一系列风险因素和病理机制表示,可以使用EHR中的临床数据来捕捉这些因素和病理机制。因此,CAD的连续表示可以区分对照组内的风险,解释疾病进展和/或严重程度的不同等级,并识别错误分类的个体。
近日,美国纽约西奈山伊坎医学院Ron Do团队在Nature Genetics上发文「Exome sequence analysis identifies rare coding variants associated with a machine learning-based marker for coronary artery disease」,研究人员一种基于机器学习的冠状动脉疾病计算机评分(ISCAD),发现ISCAD能够跟踪疾病进展、严重程度和死亡率,并揭示诊断不足。研究人员假设稀有和超稀有编码变体与ISCAD相关,ISCAD是CAD在频谱上的整体表示。为了评估这一假设,研究者在来自英国生物银行(UK Biobank)、All of Us研究计划和BioMe生物银行的604,915名个体的外显子组序列中测试了稀有和超稀有编码变体与ISCAD的关联。研究人员通过评估17个外显子组范围内显著变异和基因与67个生物标志物性状、461个barcodes和动脉粥样硬化临床表现的关联来研究它们的作用。此外,研究人员还评估了这些变异和基因与从GWAS中鉴定出的CAD基因组位点的重叠。研究者在基因集中发现了超罕见编码变异的聚集,代表了与已知和新型动脉粥样硬化机制相关的候选生物过程。最后,研究人员在由321个CAD基因组成的基因集中展示了超稀有编码变异的富集,表明具有稀有编码变异的更多基因仍有待发现。
原文链接:
https://doi.org/10.1038/s41588-024-01791-x
喜欢就点个 在看 吧 : )