生动展示 | IGV-GSAman能做什么?基因结构注释人工矫正操作大全!

文摘   科技   2024-12-07 10:14   广东  

写在前面

为了避免今天在 CGMonline 技术培训期间翻车,早起后简单对GSAman的多数操作进行了GIF动图制作,进而有今天的推文。这份推文我还是相对满意的,动图对于界面化软件的演示来说,似乎比较合适:

  1. 比文字版本更生动;

  2. 比视频讲演的信息密度更高。


回到主题,动图如下

首先是如何安装 GSAman 软件

安装GSAman 比较简单,下载好安装器之后,双击安装即可。MacOS下可能有软件安全提示,不用担心,没有毒。

如何开始 GSAman 模式

要开启 GSAman 模式,只需要修改一个GFF3或者GTF文件的文件名后缀为.gsaman 或者 .gsawoman 即可。后者是内存模式,速度快1000倍。

使用鼠标拖拽调整外显子边界

键盘摁住 CTRL,鼠标拖拽接口随意调整外显子边界

快速跳转到附近的基因

鼠标右键菜单,Quick Jump即可调出 Quick Jump 窗口,点击即可快速跳转到附近基因区域,方便快速批量矫正。也可以直接使用快捷键 Alt+J,直接调出Quick Jump窗口。

直接复制 CDS、mRNA序列和ID

IGV的使用痛点之一,是无法直接复制CDS或者mRNA序列。在GSAmanTrack中,鼠标右键菜单中可以直接支持。

支持异常外显子边界自动检测

GSAman中调整外显子边界,可以开启边界序列模式自动检测功能,可以辅助更好进行基因结构注释矫正的优化。

展示丰富的注释信息

在GSAman中,支持自定义展示的注释信息,以及标注信息,方便进行数据挖掘。

时光机/回退操作

有时候不小心搞错了,错误调整边界或者删除了转录本等,可以撤回操作。时光机支持单步或多步回退。用户可以使用 Alt+Z,回退到上一步。

切换正反链着色模式

有朋友认为正反链着色应该调换一下,所以有这个功能。

直接调用Augustus进行基因结构预测

许多时候,我们快速构建一个基因结构模型,然后在手动修改。那么可以直接调用Augustus进行预测。

借助Softberry fgenesh基因结构预测

不少人比较习惯使用 softberrty 的 fgenesh 进行基因结构注释预测。事实上,这个表现跟augustus类似。两者我认为不相上下,不过后者其实还可以自己训练模型。GSAman提供接口,支持快速导入softberrt网页预测的基因结构结果。

基于 BLAT 进行转录本重构

有时候我们有一个基因的核酸序列,知道位置,但希望得到结果注释,可以基于BLAT来重构。事实上,近源的蛋白序列作为输入也同样支持。

新增一个转录本

在一些位置的注释是缺失的,可以直接新增一个转录本,通过菜单。或者,也可以直接通过快捷键实现,Alt+N。

复制一个转录本

有时候,我们希望新增一个可变剪切,那么可以直接复制一个转录本,随后再改吧改吧得到新转录本。也有一些时候,我们担心修改出来的转录本没有原来的好,那么可以先复制一个,改吧改吧,搞定了再删除原来的。快捷键:Alt+C。

对一个转录本进行重命名

快捷键 Alt+R。

切分一个转录本为两个



有不少基因位置靠近,如串联重复,容易被组装成一个基因,这个时候最好的办法是,直接切分开来。

合并多个转录本为一个

与切分转录本正好相反,有些转录本会被组装成多个。GSAman也支持直接合并。

删除选中转录本

有些基因本身就是错误注释,直接删除即可。快捷键 Delete。

切换转录本方向

有时候一些转录本方向有问题,可以直接切换

编辑转录本信息

矫正基因结构注释的同时,常常需要对转录本进行一些文字方面注释。GSAman也支持ManInfo,方便用户快速对基因进行标签注释。可以通过鼠标右键菜单进入编辑窗口,也可以使用快捷键Alt+E快速进入。

切分一个外显子为两个

许多时候,我们不仅仅需要修改转录本,还需要对exon进行编辑。GSAman支持切换一个外显子为两个。

新增一个外显子

鼠标右键,在内含子区域可以直接新增一个外显子。当然,这个是常见操作,可以直接通过快捷键增加 Alt+x。

删除一个外显子

与增加外显子对应,我们可以删除外显子。快捷键增加 Alt+d。

预测CDS

针对矫正好的基因结构,我们需要对其进行编码区域预测,Predict CDS 可以预测最长 ORF 或者指定正负链预测。快捷键 Alt+P 会快速预测最长 ORF,往往这就是大伙想要的。

二代测序局部 de novo 组装

有时候,我们只有二代转录组测序数据,基因结构很复杂,我们希望快速重构一个转录本,那么可以直接通过对当前窗口的二代测序reads进行组装,获得序列后直接重构转录本注释。

其他功能

还有丰富功能,不做详细展示:

1. 直接定义 CDS 边界

2. 清理已有CDS注释

3. 支持本地BLAT

4. 指定某个Read Alignment结果为基因结果(适合iso-seq或nanopore)

生信石头
记录和分享生信学习经验和数据处理技巧
 最新文章