KEGG是一个综合性的生物信息学数据库,自1995年由日本京都大学建立以来,已成为基因组研究和生物信息学领域的重要工具,其在科研界的地位无人撼动,不论是宏基因组、转录组、代谢组分析,都离不开KEGG的注释。不熟悉KEGG的小伙伴可以回顾一下,今天小编将为大家介绍10月初更新的一些新功能!
本次大更新主要包括:新增病毒同源基因组(VOG)数据集、基因序列比对、通路图的分类映射、KO的人工矫正、疾病相关的网络图。
新增病毒同源基因组(VOG)数据集
KEGG数据库新增了一套针对病毒蛋白的数据集,可以通过蛋白质名称、病毒名称、病毒家族名称、巴尔的摩分类和K号进行搜索,可以对病毒蛋白与细胞生物体蛋白之间进行比较分析,扩展了KEGG在研究病毒-宿主相互作用中的应用范围。
优化基因序列比对
基因序列对比是指比较不同生物体的基因序列,识别保守序列,该方法提供了关于物种之间进化关系和功能保守性的见解。本次更新使得研究人员能够将基因顺序视为KO或VOG标识符的序列,从而简化不同基因组之间的比较。KEGG基因组浏览器使用户能够可视化基因的染色体位置,并识别不同生物体之间的保守基因顺序。它根据保守共线性对多个基因组进行比对,增强了比较基因组学研究。
通路图的分类映射
分类映射是将 KOs、模块和VOGs映射到 KEGG 分类文件中。使研究人员能够理解不同基因和通路在各种生物体中的保守性和分布情况。它通过提供对进化关系和基因及通路间功能保守性的深入理解,促进了跨物种的比较分析。可视化工具进一步增强了研究人员对这些数据的利用。
KO的人工矫正
KEGG数据库快速增长,每月新增约80个物种。为了有效管理这一增长,KEGG的KEGG同源性(KO)标识符分配过程已被简化。后台人员每天会手动校正新的KOs或修改现有KOs,以确保数据库注释的正确性。
疾病相关的网络图
KEGG数据库新增疾病相关的网络图,该部分包含了与人类疾病相关的通路图和基因信息,反映了潜在的分子机制。这些信息通过KEGG PATHWAY数据库和KEGG DISEASE数据库进行组织和展示。为理解复杂的人类疾病提供了宝贵的资源和工具。
本次KEGG新增内容极大提高了KEGG的使用范围,尤其是病毒基因组的注释。凌恩生物,作为国内测序行业的领导者,实时更新数据库,旨在为客户提供最佳结果,主力科研,我选凌恩!更多内容,欢迎致电 :13032137192。
参考文献