经验总结|ACT数据库的使用教学:单细胞转录组自动注释、细胞marker查询

文摘   2024-11-18 07:01   广东  

大家好呀!今天来跟大家分享一个我在分析自己的单细胞转录组数据的时候经常用到的一个数据库,那就是Annotation of cell types (ACT)

数据库链接:http://xteam.xbio.top/ACT/


在我们分析单细胞数据的时候,常规流程当中最让人纠结的一个步骤就是细胞类型的注释。毕竟细胞注释的结果是我们后续进行任何分析的基础。

手动注释毫无疑问是当前最主要的细胞类型注释方法,被视为绝对的金标准,但尝尝会受到专业知识和速度的限制。我自己在进行细胞类型注释时,经常会使用多种方法,耗费两三天的时间反复斟酌。因此,研究人员需要一款基于细胞标记物(cell marker),能够准确、快速、便捷地自动完成细胞类型注释的工具。

ACT是哈尔滨医科大学生物信息科学与技术学院肖云课题组于2023年11月在Genome Medicine杂志发表的题为Annotation of cell types (ACT): a convenient web server for cell type annotation的文章中开发的一个一站式细胞类型注释的工具。这个数据库包含人类的282个组织、806个细胞类型、2040个细胞层次结构的4197个标记基因,小鼠的240个组织、867个细胞类型、1627个细胞层次结构的7955个标记基因。


在这篇文章中,作者通过大量收集细胞标记物,构建了人类和小鼠的细胞标记图谱。此外,作者开发并系统评估了一种新的细胞类型注释方法WISE,并进一步推出了一站式细胞类型注释工具ACT。这一工具的构建显著提升了细胞类型注释的精确性、速度和便捷性,为科学研究中的细胞类型识别提供了高效的解决方案。


我最常使用的就是网站home页的细胞类型注释功能,只需要简单的几个步骤就可以完成:

1、在左侧我们选择好分析的物种,有人和小鼠两个选择(理论上其他物种也可以使用这个工具,只需要提前完成基因的转换即可,后面有小伙伴需要的话,可以在问题征集中提交问题,我会再出一个帖子详细去教的)。然后下面的tissue就选择自己目前所分析的组织类型。最后GSEA是指我们是否要在注释的时候同时考虑期GSEA富集结果,我一般都会选择是,实际使用下来,是否选择结合GSEA的差别不大。


2、右侧就是我们要输入的cluster-gene了。格式是每个cluster的按照差异表达倍数去排列的上调基因,每个cluster使用多少个基因去进行注释可以自己决定,我的感觉是为了保证注释的准确性,在初步注释时,不要少于10个,在进行细胞亚群细分时,最好不要少于30个。


3、然后根据下面的代码,在获取差异基因以后,将结果转换成每行是一个cluster及其差异基因的格式,可以直接复制到ACT进行注释。

注意,这里的差异基因我不是用Seurat的FindAllMarkers函数去计算的,而是用了更快、更特异的COSG算法。得到的是不是单纯的LogFC,而是scores,这些得分通常用于评估每个基因在特定细胞群中的表达显著性或区分能力,可以简单理解成差异表达倍数。


4、然后我们直接提交任务,等待的时间不会太久,就能看到注释的结果啦。每个cluster都会生成相应的注释结果。1号区域可以设置展示的数量,选择“top1”时会展示最优注释结果,而“top10”则提供多个注释选项供参考。2号区域是结果文件的下载区域,方便用户将注释结果保存。3号区域用于展示详细的注释结果,不仅显示cluster1的注释情况,还会分条展示用户输入的所有clusters的注释信息。

5、另外是这个数据库的search界面,可以在这里根据自己的组织类型和要注释的细胞类型去检索其他研究中常用的marker基因。例如我选择人类胰腺组织的CD4 T细胞查看marker基因。

6、提交以后,ACT能够以多种形式去展示我们的注释结果,够非常直观地看到该组织中该细胞类型的常用marker基因。

7、以及特定marker基因(可以在上一张图点击其他基因更换)在不同细胞类型中的表达情况。

8、接着,第三个界面是BatchACT,它能够实现批量细胞注释功能。

我们在分析中自定义的聚类数量通常难以一次性准确区分出所有细胞类型,往往需要反复调整分辨率(resolution),生成不同数量的亚群进行多次注释和效果检查。而BatchACT的批量注释功能使这一过程变得高效便捷,大幅减少了手动注释的工作量,为细胞类型的精准识别提供了强有力的支持。


10、最后就是download界面啦,在这个界面我们可以直接按照物种与组织类型下载不同组织的细胞类型与 marker 基因。


总之,ACT通过提供丰富的图表和统计信息,帮助研究人员快速准确地完成细胞类型的注释工作。这个数据库构建了一个泛组织的标记物图谱,这对于确定那些研究较少的组织的细胞类型注释尤其有用。我现在会把ACT的自动注释纳入常规分析流程中,用来辅助我完成细胞类型的注释!





本文作者是"Algernon"同学,在获得授权后,实验老司机将本文发表于公众号。

本文由作者根据自身经验总结而成,内容仅供参考。

文稿:Algernon

校对:煲仔饭

参考文献:

Quan, F., Liang, X., Cheng, M. et al. Annotation of cell types (ACT): a convenient web server for cell type annotation. Genome Med 15, 91 (2023). https://doi.org/10.1186/s13073-023-01249-5





往期文章推荐

经验总结|科研中常用到的在线工具、网站或数据库系列(1)


手把手教学|如何利用DAVID数据库进行GO、KEGG富集分析


手把手教学|String数据库与Cytoscape软件联合应用


手把手教学|USFC Chimera X 的使用





实验老司机分享生命科学实验知识,通过短视频、在线讲座、直播演示帮助新手实验操作者完成从0到1的入门学习。

exdrive.cn
公众号、视频号、知乎、Bilibili
抖音、西瓜、今日头条、小红书
内容同步



实验老司机
关注老司机,实验不死机。实验老司机分享生命科学实验知识,通过短视频、在线讲座、直播演示帮助新手实验操作者完成从0到1的入门学习。
 最新文章