在高等真核生物中,DNA胞嘧啶修饰包括5-甲基胞嘧啶和5-羟甲基胞嘧啶,广泛参与基因调控其他细胞过程。分析胞嘧啶修饰揭示了人类发育和疾病中染色质动力学和表观遗传失调的原理。全基因组胞嘧啶修饰谱的知识揭示了细胞身份、细胞病理状态和有丝分裂历史,并在医学上具有治疗和诊断的潜力。Illumina的Infinium技术——基于DNA甲基化微阵列检测方法,一直是人类(图1)以及小鼠和其他哺乳动物物种中基因组学研究中最广泛使用的技术。该技术基于磁珠技术结合50nt靶标特异性寡核苷酸,与亚硫酸氢盐转化的基因组DNA杂交。甲基化检测采用两种Infinium化学方法之一。Infinium- I化学涉及两种珠子类型-一种针对甲基化胞嘧啶,而另一种则针对未甲基化的胞嘧啶。Infinium- II化学仅使用一种珠子类型,使用颜色-圆盘边缘重新评定两个甲基化状态。与其它全基因组甲基化检测技术,如高通量亚硫酸氢盐测序相比,Infinium甲基化芯片更具成本效益、定量、用户友好度高、生物信息学软件工具成熟的优点。GEO数据库中存放了超过10万样本是由Human Methylation 450 BeadChips(HM450)检测数据。
图1 Infinium DNA甲基化芯片研究和GEO数据总数
人类Infinium BeadChip检测方法已经经过多代发展,范围从HM27、HM450、EPICv1,直至最新的EPICv2。每一代都体现了对人类基因组更全面的覆盖范围和更灵活的功能探针设计,从而扩展了对DNA甲基化生物学的理解。例如,DNA甲基化最初最著名的是其在基因启动子表观遗传沉默中的作用。第一个Infinium芯片HM27仅包含~27,000个探针来查询启动子CpG甲基化。HM450扩展HM27,以包括查询基因body CpG的甲基化,对基因表达调控中基因body甲基化的认识日益增长。2015年发布的EPIC阵列,最显著地扩展了肿瘤-调控元件,反映了对这些携带组织特异性甲基化标志的增强子日益增长的认识。
基因组覆盖范围的扩展加深了Infinium化学及其非传统应用实践理解。最值得注意的是,发现Infinium-I探针带外通道信号可以用于参数化背景减除和检测p值计算。同样地Infinium-I探针延伸开关实际上可用作SNP探针来推断受试者的种族。总信号强度可以用于推断拷贝数变异,最近还用于推断细胞比例。该芯片还被证明可以与其他碱基转换方法一起应用检测5mC和5hmC。Illumina最近推出了Infinium BeadChip EPICv2。随着芯片和测序技术之间的成本优势逐渐缩小,基于Infinium芯片平台的更新或许会在其他方面带来优势。
综合分析不同代甲基化芯片的探针设计、甲基化检测性能以及在大规模队列研究中的实际应用进行了关键评价,同时做了甲基化芯片与WGBS的数据对比(图6)。EPICv2提高了探针映射和实用性(图2,3)。EPICv2在不同样本或技术重复之间生成高度可重复的数据(图4,5)。
图2 HM450、EPICv1、EPICv2的探针及EPICv2的独有探针
图3 EPICv2从先前代芯片中保留探针的数量和百分比
图4 技术重复的甲基化测量相关性
图5 不同细胞系和相同细胞系的EPICv2和WGBS的相关性
图6 EPICv2与WGBS检测的DNA甲基化水平的比较
众所周知DNA甲基化(DNAm)是人类群体中最常检测的表观遗传机制,大多数研究使用Illumina阵列来评估DNA甲基化水平。2023年,Illumina更新了DNA甲基化芯片EPICv2,基于之前EPICv1和450K芯片的迭代,DNA甲基化的检测结果在三款芯片之间是否是稳定的呢?此前尚未有研究,这限制了研究人员,特别是那些进行纵向数据的科学家在不同阵列之间比较和重复结果的能力。近日哈佛医学院的团队最新发布了来自Drakenstein儿童健康研究的30名儿童参与者(15名男性,15名女性)的研究结果,在450K、EPICv1和EPICv 2这三款甲基化芯片上都进行了DNA甲基化检测。利用这些数据创建了对探针质量的注释,涵盖了所有CpG位点,包括组内相关性、四分位数范围、相关系数和芯片偏差(DNA甲基化水平由芯片类型解释的程度)。还展示了性别差异分析的结果,发现跨芯片重复性较低的CpG位点具有更高的基于芯片的变异度。此外,就主要版本的表观遗传时钟来说,在跨芯片类型估计表观遗传年龄方面更为稳定。总之这一系利用三款不同芯片版本的检测对比分析结果为用于研究IlluminaDNAm阵列多个版本之间的表观遗传变化的可重复性和纵向稳定性提供了指导。
图7 450K、EPICv1和EPICv 2的探针水平(平均值、标准差、四分位、平均差异)
图8 跨芯片类型的表观遗传年龄估计值的成对比较。包含了7个甲基化时钟及主要版本。
▪全面的基因组覆盖范围:检测> 935,000个CpG位点,全面覆盖CpG岛、启动子、编码区及增强子。
▪探针位点的全面优化:在EPICv1.0-850K的基础上去除了性能不佳的探针,新增186,000个CpG靶向增强子和超级增强子、更多CTCF结合位点、CNV检测区域、EPIC v1.0覆盖不足的CpG岛以及常见癌症驱动突变。
▪兼容多种样本类型,包括FFPE、新鲜/冷冻组织、全血、口腔细胞、cfDNA、唾液和其他样本类型。
▪高质量的数据:沿用了450k芯片的Infinium技术,同时采用Infinium I及II探针设计,使检测范围最大化。
▪分辨率高:单碱基分辨率,可以直接检测到发生甲基化的准确位点。
▪可重复性高:自身技术重复间的相关性以及与850K相同探针间的相关性R2 > 0.99。
▪注释信息:人参考基因组版本更新到hg38,GenCode数据库更新到v41版本。
▪伯豪生物从事技术服务18年,承接项目超过10000个,服务过超3000家科研高校和医院,企业客户。公司拥有40多项发明专利和软件著作权。已经成功研发20余种试剂产品,进入市场销售。协助客户发表SCI论文近3000篇,涉及多癌种的FFPE、血、cfDNA等多种组织类型,文献平均影响因子超过7分。
参考文献:
[1] Kaur D, Lee SM, Goldberg D, et al. Comprehensive Evaluation of The Infinium Human MethylationEPIC v2 BeadChip. Epigenetics Commun. 2023;3(1):6.
[2] Lussier AA, Schuurmans IK, Großbach A, et al. Technical variability across the 450K, EPICv1, and EPICv2 DNA methylation arrays: lessons learned for clinical and longitudinal studies. Clin Epigenetics. 2024;16(1):166. Published 2024 Nov 22.
推荐阅读
本文为伯豪生物原创
欢迎转发朋友圈
转载请注明来自伯豪生物
咨询热线:17702139967
邮箱:market@shbio.com
发现“分享”和“赞”了吗,戳我看看吧