科研文献丨Salus Pro测序平台助力10种微生物变异分析工具的研究与比较

文摘   2024-08-21 14:00   广东  
研究研究概要
研究概要
RESEARCH SUMMARY
浙江大学的国家重点实验室State Key Laboratory for Diagnosis & Treatment of Infectious Diseases联合杭州微数生物科技有限公司在Infectious Microbes & Diseases杂志上发表了“Evaluation of 10 Different Pipelines for Bacterial Single-Nucleotide Variant Detection”的研究成果。该研究围绕细菌单核苷酸变异(SNV)检测工具的研究及比较展开,系统性比较了10种不同的变体检测工具,使用18个细菌模拟数据集和17个在Salus Pro测序仪平台产出的真实高通量测序数据集,以评估它们在不同覆盖度、模拟数据和菌株多样性条件下的敏感性。研究发现,GATK工具包中的HaplotypeCaller在变异检出的准确性和稳健性方面表现最优,而CFSAN和Snippy在多个模拟和真实测序数据集中表现不佳。该研究结果为高通量细菌基因组测序数据选择最佳变异检测工具提供了指导。

研究研究概要
研究背景
RESEARCH BACKGROUND

基因组分析已成为微生物学研究中的重要工具,包括微生物群体的遗传多样性、进化、种群结构以及与毒力和耐药性相关的机制等方面。单核苷酸变异(SNV)检测是基因组数据分析的关键步骤。然而,由于样本污染、测序错误、菌种多样性等原因,细菌基因组变异分析依然面临诸多挑战。

虽然已有多种生物信息学工具用于解决这些问题,但它们在细菌基因组变异检测方面的性能和准确性尚未得到系统的评估。因此,本研究对现有SNV检测工具进行了系统性评估,以确定它们在处理高通量细菌基因组测序数据时的准确性、稳健性和适用性,这不仅有助于优化工具和流程,也对微生物学研究和临床实践具有重要意义。

研究研究概要
研究设计
RESEARCH DESIGN

研究纳入了31种细菌,包含了革兰氏阳性菌、革兰氏阴性菌、球菌,杆状菌、需氧菌和厌氧菌,并考虑了不同基因组大小、GC含量、致病性和氧敏感性。研究对所有31种细菌进行了数据模拟及高通量测序,测序数据被映射到参考基因组上,使用10种分析工具(包括GATK_HaplotypeCaller、GATK_Mutect2、Snippy和CFSAN等)进行SNV检测。

图1. 研究设计
研究研究概要
研究结果概览
RESEARCH FINDINGS

1.模拟数据集评估

在模拟数据集评估环节,研究使用了18个细菌基因组数据集,包含了已知的300个SNVs。从结果看CFSAN、Snippy和GATK-H-P1三种流程均未产生假阳性结果,显示出了良好的特异性,GATK-H-P1在模拟数据集上的敏感性最高,达到了约99.4%,而Snippy和CFSAN的敏感性大约为97%。

图2. 模拟基因组数据集在3种软件上的SNV检测灵敏度

2.真实数据集评估

在真实测序数据评估中,对17个真实细菌的46组高通量测序数据集进行了分析,其中11种菌株具有参考基因组。结果显示,GATK-M-homo-P1和GATK-M-homo-P2在具有参考基因组的菌株上表现不佳,未能有效检测到SNVs,而Snippy、CFSAN和GATK-H-homo-P1软件的检出结果具有可比性。

表1. 有参考基因组的细菌检出的变异数

注:GATK工具包中的HaplotypeCaller流程包括GATK-H-homo-P1和GATK-H-homo-P2,Mutect2流程包括GATK-M-P1和GATK-M-P2
对于没有标准参考基因组的细菌,进行了基因组组装后进行SNV检测。从理论上讲,在“组装和检测”模式下应该尽可能少地检测到SNV,结果表明Snippy、CFSAN、GATK-H-homo-P1和GATK-H-homo-P2检测到的SNVs数量较少。同时,GATK-M-P1和GATK-M-P2检测的变异更多,说明这两个软件不适用于无参考基因组的细菌的SNV检测。

图3. 在组装模式下8种piplines对无参考基因组细菌的检测结果

3.重复测序数据集的一致性评估

研究对Staphylococcus hominis菌株进行了30次重复测序,以评估不同流程的一致性。结果显示,GATK-H-homo-P1和GATK-H-homo-P2在不同条件下对细菌SNVs的检测效果最好。Snippy、CFSAN、GATK-H-P1、GATK-H-P2、GATK-M-P1和GATK-M-P2,在检测细菌SNVs的准确性、灵敏度等指标时表现出显著的偏倚。因此,研究推荐使用GATK-H-homo-P1或GATK-H-homo-P2进行细菌SNV检测。

研究研究概要
研究结论
RESEARCH CONCLUSIONS

研究团队采用了模拟和真实世界的测序数据集,对每个流程的变异检测结果进行了细致的分析。研究结论指出,GATK工具包中的HaplotypeCaller流程在检测细菌单核苷酸变异方面表现最佳,CFSAN和Snippy的性能不如HaplotypeCaller流程,它们可能不适用于所有类型的细菌基因组数据,而Mutect2流程则不适用于细菌SNV的检测。

这项研究不仅为科研工作者提供了选择最佳变异检测流程的建议,也显示了评估这些工具的重要性。该项研究也证明了Salus Pro测序仪在提供高质量测序数据方面的重要价值,随着基因组学技术的不断进步,Salus Pro测序平台将持续助力对微生物世界的认知,为医学研究、疾病监测和生物技术应用开辟新的道路。



参考文献

Hu, Zi-Hao1,2,#; Wang, Ying3,#; Yang, Long4; Cao, Qing-Yi2; Ling, Ming5; Meng, Xiao-Hua2; Chen, Yao2; Ni, Shu-Jun2; Chen, Zhi2; Liu, Cheng-Zhi3,✉; Su, Kun-Kai2,✉. Evaluation of 10 Different Pipelines for Bacterial Single-Nucleotide Variant Detection. Infectious Microbes & Diseases 5(4):p 172-179, December 2023. | DOI: 10.1097/IM9.0000000000000134 



原文链接

https://journals.lww.com/imd/fulltext/2023/12000/evaluation_of_10_different_pipelines_for_bacterial.3.aspx









关于赛陆医疗


赛陆医疗创办于2020年,是国家高新技术企业和深圳市专精特新中小企业,专注于开发自主知识产权的上游测序平台,并基于其上构建了全球领先的超分辨空间组学平台,实现基因组学和空间组学产品的自主开发及科研临床端转化。公司突破了以往测序和组学产品在通量、成本、分辨率、自动化等方面的瓶颈,取得欧盟CE-IVDR等多项关键认证。公司发展迅速,现拥有国际领先的测序和组学平台,可以为中下游应用提供全面的解决方案,产品畅销海内外。





往期推荐
Historical articles

赛陆医疗Salus Pro高通量测序仪新品发布会成功举办



用户实测 | Salus Pro 实力到底如何,数据来说话!



基因组学领域迎来强强联手丨赛陆医疗、瑞普基因、墨卓生物达成战略合作



赛陆医疗Salus Pro高通量基因测序仪获欧盟CE-IVDR认证






Contact


公司地址:深圳市光明区凤凰街道塘尾社区恒泰裕大厦1栋2001

公司电话:0755-2374 5832

电子邮箱: info@salus-bio.com

与时竞“赛”,开启测序自由之“陆”!



赛陆医疗
以自主研发顶尖自动化、智能化空间生物学基础设施为己任,以透视基因组、转录组、表观组、代谢组、蛋白组的功能及相互作用网络为目标,打造探索人类生命构造的理想工具。
 最新文章