写在前面
为了避免今天在 CGMonline 技术培训期间翻车,早起后简单对GSAman的多数操作进行了GIF动图制作,进而有今天的推文。这份推文我还是相对满意的,动图对于界面化软件的演示来说,似乎比较合适:
比文字版本更生动;
比视频讲演的信息密度更高。
回到主题,动图如下
首先是如何安装 GSAman 软件
安装GSAman 比较简单,下载好安装器之后,双击安装即可。MacOS下可能有软件安全提示,不用担心,没有毒。
如何开始 GSAman 模式
要开启 GSAman 模式,只需要修改一个GFF3或者GTF文件的文件名后缀为.gsaman 或者 .gsawoman 即可。后者是内存模式,速度快1000倍。
使用鼠标拖拽调整外显子边界
键盘摁住 CTRL,鼠标拖拽接口随意调整外显子边界
快速跳转到附近的基因
鼠标右键菜单,Quick Jump即可调出 Quick Jump 窗口,点击即可快速跳转到附近基因区域,方便快速批量矫正。也可以直接使用快捷键 Alt+J,直接调出Quick Jump窗口。
直接复制 CDS、mRNA序列和ID
IGV的使用痛点之一,是无法直接复制CDS或者mRNA序列。在GSAmanTrack中,鼠标右键菜单中可以直接支持。
支持异常外显子边界自动检测
GSAman中调整外显子边界,可以开启边界序列模式自动检测功能,可以辅助更好进行基因结构注释矫正的优化。
展示丰富的注释信息
在GSAman中,支持自定义展示的注释信息,以及标注信息,方便进行数据挖掘。
时光机/回退操作
有时候不小心搞错了,错误调整边界或者删除了转录本等,可以撤回操作。时光机支持单步或多步回退。用户可以使用 Alt+Z,回退到上一步。
切换正反链着色模式
有朋友认为正反链着色应该调换一下,所以有这个功能。
直接调用Augustus进行基因结构预测
许多时候,我们快速构建一个基因结构模型,然后在手动修改。那么可以直接调用Augustus进行预测。
借助Softberry fgenesh基因结构预测
不少人比较习惯使用 softberrty 的 fgenesh 进行基因结构注释预测。事实上,这个表现跟augustus类似。两者我认为不相上下,不过后者其实还可以自己训练模型。GSAman提供接口,支持快速导入softberrty 网页预测的基因结构结果。
基于 BLAT 进行转录本重构
有时候我们有一个基因的核酸序列,知道位置,但希望得到结果注释,可以基于BLAT来重构。事实上,近源的蛋白序列作为输入也同样支持。
新增一个转录本
在一些位置的注释是缺失的,可以直接新增一个转录本,通过菜单。或者,也可以直接通过快捷键实现,Alt+N。
复制一个转录本
有时候,我们希望新增一个可变剪切,那么可以直接复制一个转录本,随后再改吧改吧得到新转录本。也有一些时候,我们担心修改出来的转录本没有原来的好,那么可以先复制一个,改吧改吧,搞定了再删除原来的。快捷键:Alt+C。
对一个转录本进行重命名
快捷键 Alt+R。
切分一个转录本为两个
有不少基因位置靠近,如串联重复,容易被组装成一个基因,这个时候最好的办法是,直接切分开来。
合并多个转录本为一个
与切分转录本正好相反,有些转录本会被组装成多个。GSAman也支持直接合并。
删除选中转录本
有些基因本身就是错误注释,直接删除即可。快捷键 Delete。
切换转录本方向
有时候一些转录本方向有问题,可以直接切换
编辑转录本信息
矫正基因结构注释的同时,常常需要对转录本进行一些文字方面注释。GSAman也支持ManInfo,方便用户快速对基因进行标签注释。可以通过鼠标右键菜单进入编辑窗口,也可以使用快捷键Alt+E快速进入。
切分一个外显子为两个
许多时候,我们不仅仅需要修改转录本,还需要对exon进行编辑。GSAman支持切换一个外显子为两个。
新增一个外显子
鼠标右键,在内含子区域可以直接新增一个外显子。当然,这个是常见操作,可以直接通过快捷键增加 Alt+x。
删除一个外显子
与增加外显子对应,我们可以删除外显子。快捷键增加 Alt+d。
预测CDS
针对矫正好的基因结构,我们需要对其进行编码区域预测,Predict CDS 可以预测最长 ORF 或者指定正负链预测。快捷键 Alt+P 会快速预测最长 ORF,往往这就是大伙想要的。
二代测序局部 de novo 组装
有时候,我们只有二代转录组测序数据,基因结构很复杂,我们希望快速重构一个转录本,那么可以直接通过对当前窗口的二代测序reads进行组装,获得序列后直接重构转录本注释。
其他功能
还有丰富功能,不做详细展示: