circRNA(环状 RNA)在生命活动中起着至关重要的作用。它们具有独特的结构和功能,circRNA不具有5'端帽子和3'端poly(A)结构,相反,circRNA通过共价键将3'和5'末端连接起来形成完整的环形结构,避免被核酸外切酶降解,因而比线性RNA更稳定,更具有保守性。circRNA 可能参与基因表达的调控。它们可以通过与 miRNA(微小 RNA)相互作用,影响 miRNA 对靶基因的调控,从而在转录后水平调节基因表达。因此对circRNA的鉴定。
CIRCexplorer2和CIRI是目前circRNA产品中的两款circRNA鉴定工具,CIRCexplorer2需要【基因注释文件】和【参考基因组序列文件】来注释环状RNA,具有高准确性;CIRI是一款使用BWA-MEM比对结果,支持基于BSJ de novo的检测,具有高灵敏度。find_circ也是一款支持BSJ de novo检测的circRNA鉴定工具,除了常规的鉴定工作外,在鉴定circRNA数量明显偏低的样本中也可以使用find_circ进行circRNA的补充鉴定,辅助说明非分析流程导致的数目偏低。
find_circ的基本原理:find_circ根据bowtie2比对结果,从没有比对到参考序列的reads的两端各提取20nt的anchor序列,将每一对anchor序列再次与参考序列比对。如果anchor序列的5' 端比对到参考序列(起始与终止位点分别记为A3,A4),anchor序列的3'端比对到此位点的上游(起始与终止位点分别记为A1,A2),并且在参考序列的A2到A3之间存在剪接位点(GT-AG),则将此read作为候选circRNA。最后将read count大于等于2的候选circRNA作为鉴定的circRNA。
find_circ是基于py脚本进行circRNA的鉴定,其需要使用Bowtie2进行circRNA反向剪切位点鉴定相关的序列比对,也需要提供基于Bowtie2建立的基因组索引。(服务器已安装,直接调用即可)。如果项目是在联川开展和分析的,基因组建库时已经构建好索引(基于分析参数的基因组路径查询索引,Bowtie2索引和HISAT2是提前构建好的),分析流程中已包含unmapped.bam,直接进入步骤2即可。如果没有,可以参考下述命令,使用Bowtie2进行基因组索引构建和比对(Bowtie2索引为鉴定circRNA所必须,但是基因组比对可以使用Bowtie2、HISAT2、TopHat中的任意一款,此处不做示例),使用samtools进行unmapped.bam的提取。
|
find_circ基于比对工具(比如Bowtie2、HISAT2、TopHat等)输出的unmapped.bam进行下游分析。如果是原始数据,可以使用Bowtie2、HISAT2、TopHat进行基因组比对并输出unmapped.bam。
以下是运行指令:
|
我们来看一下最终的输出结果:
find_cric最终输出文件为find_circ.candidates.bed,输出circRNA的候选,内容如下:
列说明如下:
find_circ的检出效率比CIRCexplorer2稍高,但和CIRI相差无几,使用find_circ不一定显著增加circRNA的鉴定数目,且不同的上游基因组比对工具(Bowtie2、HISAT2、TopHat)衔接find_circ鉴定的circRNA数量有所不同,但没有显著差异。find_circ的优点是对于基因组注释不完善的物种进行circRNA的鉴定,甚至没有基因组的物种(需要较为完善的全长转录组数据),且能分析来自线粒体的circRNA(在结果筛选时不过滤线粒体来源),并且find_circ基于python2,无需安装,便于快速上手使用。
|
|
解析细胞功能基因集变异——遇见GSVA|生信开发实战
单细胞评分分析R包Ucell
空间转录组细胞注释软件之Cell2location |生信开发实战
单细胞代谢分析之-scFEA
本文系联川生物公众号原创文章,未经授权禁止转载,侵权必究! 扫描下方二维码 点分享
点点赞
点在看