西安交通大学叶凯课题组开发样本间基因组结构变异差异检测算法SVision-pro

科学   2024-04-09 18:34   英国  


研究背景

      基因组结构变异在生物性状演化和严重疾病表型中具有重要作用。2022年,西安交通大学叶凯教授团队提出了SVision算法,可高精度检测生殖细胞结构变异,并解析了不同人种在神经发育基因CNTN5上的复杂结构变异。然而,遗传病和癌症的机理研究需要比较多个样本之间的变异差异,尤其是的新发结构变异和体细胞结构变异。现有样本间结构变异差异计算方法大多采用“先检测再求差”的分步式策略,导致错误累计快、假阳性高,无法精确解析新生结构变异和体细胞结构变异,限制了其在大规模生物医疗数据场景中的应用。

研究结果与展望

      为了解决上述问题,西安交通大学叶凯教授课题组提出了SVision-pro算法,基于“序列-图像”转换策略,将样本间结构变异差异检测问题从序列层面转化为图像空间的变异实例分割问题,直接比较图像化的样本测序差异。该算法的编码表征模块实现了“基因组对基因组”的测序信息图像化表征,通过“定框架、填内容”的方式,实现了结构变异的类型和样本间差异在图像上统一表征。其比较识别模块通过像素级别的实例分割神经网络,一体化地对图像内变异的类型、位置和等位基因频率进行高分辨率识别,保证了对全类型结构变异和复杂结构变异的全面检测。为了保障分析处理大规模数据的计算效率,SVision-pro算法在保持识别精度的前提下,尽可能地降低神经模型参数规模,同时要求模型具有良好的可解释性。最终,实现了新生结构变异和体细胞结构变异的快速、高精度和低假阳性的检测。


      SVision-pro算法突破了传统“先检测再求差”的策略,大幅度降低了新生结构变异检测的假阳性率,并在低频体细胞结构变异的检测中取得高精确率。本项研究作为“人工智能+”交叉研究的典型案例,为后续大规模临床遗传、疾病数据队列的结构变异研究奠定了基础。
作者简介
      西安交通大学信息与生物医学交叉研究中心长期致力于结构变异的精细解析计算方法学研究及其应用。该中心以信息科学、生命科学和医学交叉的模式,引领前沿计算和生物技术智能化。中心负责人叶凯教授为论文的通讯作者,中心培养的博士生王松渤为论文的第一作者。

点击蓝字 · 关注我们

版权声明:本文内容由Nature Biotechnology 刊发文章的原文作者提供,本文所表述的观点均为原文作者的观点。中文内容仅供参考, 一切内容以英文原版为准,欢迎转发至朋友圈。未经允许,请勿转载。未经授权的翻译是侵权行为,版权方将保留追究法律责任的权利。

© 2024 Springer Nature Limited. All Rights Reserved.

欢迎点赞,在看+转发!

NBiotechnology
Nature Biotechnology 《自然生物技术》期刊致力于服务科学界,探索尖端科技与生命科学的交汇之处。 我们将涵盖生物学, 生物医学, 农业和环境领域,为相关最新研究成果的发布提供平台。《自然生物技术》期刊成立于1996年。
 最新文章