报告人介绍
杨炳 yangbingheart@163.com
目前博士就读于中国农业大学,导师为周欣教授和刘山林研究员。硕士就读于首都师范大学,导师为张爱兵教授。主要从事计算生物学算法开发和基于组学大数据挖掘解析蜜蜂社会生物学研究。以第一作者身份在Systematic Biology和Molecular Phylogenetics and Evolution等杂志上发表论文,并为Molecular Phylogenetics and Evolution进行审稿。
报告题目:
基于人工智能进行物种识别界定和地理种群谱系溯源
生物多样性是生命长期演化的结果,也是人类文明赖以生存的基础,人类对于生物多样性的认知在近几十年取得许多重要进展,然而作为现代分类学重要基础的经典林奈分类学,面临着趋同进化、表型可塑性的重要挑战;另一方面新兴的DNA分类方法则由于基因渐渗、不完全谱系分选和基因水平转移现象而导致物种鉴定存在潜在谬误。虽然整合分类学思想早在2005年就被提出,但在过去这些年间,鲜有相关的新算法报道,尤其是基于深度学习的整合新算法。我们构建了一种新的深度学习网络模型(MMNet),首次实现了将形态学和分子数据自动化整合用于物种鉴定。并在甲虫、鸟、蝴蝶、鱼、飞蛾、蝗虫、蜜蜂和植物数据集进行测试,结果表明所提出的MMNet新方法显著优于常用的利用单一数据的方法(准确率96.3%-100%)。
从生物分类学的角度看,谱系溯源(genealogy origin)的需求属于种下分类的范畴。随着全球贸易和人口流动的持续性增长,现代社会对种下分类的实际需求与日俱增。但是,与分类学经典学科不同,种下分类领域受到的关注度远远不够,相关的方法学和实际研究案例都明显匮乏。我们开发了基于卷积神经网络模型——TraceNet,旨在利用全基因组的单核苷酸多态性(SNP)标记进行谱系溯源,以建立待验个体与参考种群之间的谱系联系。我们使用五个数据集评估了该模型的性能,包括三个动物类群真实数据集(东方蜜蜂、红火蚁和家鸡),以及两个模拟数据集。结果显示,新方法能够准确识别待验个体的种群来源,成功率在93-100%之间。