缪嘉诚是威斯康星大学麦迪逊分校生物统计与医学信息学系的五年级博士生,由Qiongshi Lu和Lauren Schmitz共同指导。他的研究致力于利用人工智能和机器学习技术助力遗传学和科学上的新发现, 同时深入探讨药物效应和遗传效应异质性的机制及其影响。此外, 他还专注于提升疾病遗传风险预测在不同祖源多样性人群中的泛化能力。
机器学习在包括人类遗传学在内的几乎所有科学领域中变得越来越流行。由于样本收集和精确表型测定的挑战,利用复杂的机器学习技术预测表型,并在预测结果上执行全基因组关联研究的机器学习辅助全基因组关联研究在复杂性状遗传学研究中变得越来越普遍。然而,机器学习辅助全基因组关联研究关联结果的有效性尚未得到充分评估。在本研究中,我们揭示了机器学习辅助全基因组关联研究中广泛存在的假阳性关联风险,并引入了一种名为POP-GWAS的统计框架,对基于机器学习预测的表型的全基因组关联研究进行重新设计。POP-GWAS能够在任意机器学习预测质量和算法选择下,确保统计推断的有效性和高效性,同时仅依赖全基因组关联研究的汇总统计作为输入。我们利用POP-GWAS对来源于双能量X射线吸收测量图像的14个骨骼部位的骨密度进行了全基因组关联研究,发现了89个新的遗传位点,并揭示了骨骼部位特异性的遗传结构。我们的框架为未来机器学习辅助下的全基因组关联研究提供了一种强大的分析解决方案。
关键词:AI4Science,全基因组关联研究
1. Miao, J., Wu, Y., Sun, Z. et al. Valid inference for machine learning-assisted genome-wide association studies. Nat Genet 56, 2361–2369 (2024). https://doi.org/10.1038/s41588-024-01934-0
2024年12月3日 星期二 09PM(北京)
2024年12月3日 星期二 02PM(欧中)
2024年12月3日 星期二 07AM(美东)
Zoom会议链接: https://us06web.zoom.us/j/87870509801?pwd=SGpvdEc3YVRQL2twTmJyenhnTDFrZz09
Zoom会议ID:878 7050 9801
密码:207409
更多途径关注我们
Bilibili:CGMonline 欢迎点赞、关注、投币!
CGM网站:cgmonline.co
微信群: 请添加微信"ll68551551"申请加群,并请注明"CGM+姓名单位"。