网络药理学保姆级做图教程!轻松构建美观华丽的药物成分靶点基因网络!

学术   2024-10-27 19:00   上海  

哈喽小伙伴们大家好~果叔在之前给大家介绍如何构建PPI网络,相信大家都非常喜欢用华丽的PPI网络图来给自己的论文“装修”一下:不仅操作简单,看起来高端大气上档次,而且还非常专业“有内涵”哦。其实除了PPI网络之外,其实还有一个网络图也非常的美观并且实用,甚至更加有层次感,那就是今天果叔给大家带来的药物成分靶点基因网络。这个网络的内容更加丰富,可以同时看到药物、活性成分和靶点基因之间的关系,而不仅仅是蛋白质基因之间的关系,可是它绘制起来却丝毫不比PPI复杂,简直是所有网络药理学小伙伴的福音!果叔今天就给大家带来了它的全网最详细教学,是不是非常期待呢~废话不多说,我们直接开始吧!
(小伙伴们有任何生信相关的问题欢迎随时来找果叔哦~果叔在生信耕耘十余年,非常乐意帮助生信路上新的小伙伴们,热点、思路、分析方法,来找果叔应有尽有!另外如果有需要服务器的小伙伴们也可以来找果叔租,果叔专门搭建的用于生信分析的服务器性价比拉满哦)

跑代码时卡顿、电脑不给力让人抓狂!找果叔试用稳定高速的服务器,让分析顺畅无比!

代码学不会?bug 频繁出现,束手无策?实操生信分析课程赶快学起来!滴滴果叔领取体验课程哦~


线上课程教学

课题设计、定制生信分析

云服务器租赁

加微信备注99领取使用



在构建药物-成分-基因靶点网络之前,我们需要先制作Network文件和tape文件。Network文件通常用于定义网络的结构,包括节点(如药物、成分、靶点)和边(表示药物与靶点之间的相互作用或成分与药物之间的组成关系),而tape 文件通常用于存储网络的拓扑信息,即每个节点的类型(molecular、gene和drug)
network文件有两列,第一列是药物主要成分的ID。因为药物主要成分的名称字数太多不方便观看,所以我们需要用代号来指代,果叔的药物是鹿茸,所以主要成分就用lurong+数字来表示。第二列是该成分对应的靶点基因。我们直接将之前在BATMAN-TCM数据库筛选好的药物成分-靶点基因表粘贴过来,然后使用excel的替换功能将每种成分用代号来替换完毕即可。    
           

 

在最后我们记得将这些成分与我们的药物联系起来,所以还需要像下面果叔一样写上代码和药物。
           

 

在tape文件中,第一列是Network文件中各种出现过的主要成分代号、药物名以及靶点和疾病交集基因,第二列则是他们的类型。像果叔下面这样:(mol代表molecular,表示成分分子;gene表示疾病和靶点交集基因;drug表示药物)    
           

 

           

 

两个文件准备完毕后,使用这两个按钮将他们导入CYTOSCAPE中。
     

 

导入Network文件时果叔一般选择ID为绿色的圆source node,target为橙色的靶target node,两个的数据类型均为字符string。导入tape文件时直接导入即可。    
           

 

导入完毕后我们可以在layout tools改变排列样式,小伙伴们按自己的心意自行调整即可。
           

 

   
我们可以在右下角发现,tape这一栏有很多是空缺的,空缺的行代表着这些基因并不是靶点和疾病的交集基因,而是单纯的靶点基因或者交集基因,因此我们需要将他们删除。
删除的方法是,首先在filter新建column filter,选中node:tape的,然后选择doesn't contain,就选中了所有tape栏空缺的节点,直接删除即可。
           

 

果叔在这里提醒大家,网上有很多教程教了一种麻烦并且错误的筛选方式,那就是在node:tape下依次输入gene、mol和drug,每次选中后将它们使用鼠标拖远,然后将剩余的节点全部选中(按住shift使用鼠标左键画框选中)并删除。这样做容易把节点间的相互作用(边)一起删除,如下面果叔所示:    
           

 

           

 

   
           

 

果叔将gene拖到左边,drug拖到右边,mol拖到上面后,将中间剩余的节点全部删除。
           

 

可以看到,边也都跟着一起被删除了。果叔之前指导的好多小伙伴们都出过这样的问题,因此果叔在这里跟大家强调一下哦~    
在删除完非交集基因节点后,我们就可以开始绘图啦。首先我们选中所有基因,然后在filter新建degree filter。degree的详细介绍如下:
degree(度)是最简单的拓扑指标,它对应于给定节点v相邻(直接相连)的节点数。直接连接到给定节点v的节点也被称为该节点的“第一邻接节点”。因此,度也对应于相邻入射边的数量。在有向网络中,入度(in-degree)表示当边指向节点v时,以及出度(out-degree)表示当边指向v的相邻邻居时。在生物学术语中,度评估节点的调控相关性。在信号网络中,度非常高的蛋白质与多个其他信号蛋白质相互作用,暗示该蛋白质是一个中心调控角色,即它可能是调控的“枢纽”。例如,由致癌基因编码的信号蛋白质,如HRAS、SRC或TP53,就是枢纽。根据蛋白质的性质,度可能表明在放大(激酶)、多样化和周转(小GTP酶)、信号模块组装(停靠蛋白)、基因表达(转录因子)等方面的核心角色等。信号网络通常具有无尺度架构(scale-free architecture)。
由此可见,degree越高,则蛋白越重要。我们可以在左下角看到目前gene节点有227个,如果只做一层图会过于繁杂单调且没有层次。
           

 

因此果叔决定将gene分为两圈。将degree值较小的和较大的依次按照圆形排列,再调控它们的大小,让他们呈现为同心圆。果叔的具体操作如下:
将degree设置为1时有138个节点被选中,将它们按圆形排列:    
           

 

将degree设置为大于等于2时有89个节点被选中,将它们按圆形排列,然后拖到到大圆内:
           

 

   
           

 

选中所有tape为mol的节点(即主成分),因为数量比较少则直接绘制为一层圈即可,然后拖动到圆的中心,最后再将drug节点拖到圆心:
           

 

果叔注意到gene节点中degree大于等于2的节点圆有点大,则我们再选中这个圆后使用右下角的layout tools拖动scale调整它:    
           

 

然后我们就可以调节网络的样式啦:点击style,点击我们想要调节的参数,column选择tape,mapping type选择discrete mapping,这样我们就可以按照tape的不同来直接给节点选择不同的参数啦。这里需要注意的原则是:节点的宽度和高度不能太小,至少要把标签包含住;但也不能太大,不然节点之间连成一片相互遮挡。字体和节点的颜色不能太接近,要让标签醒目。
果叔最后提醒大家一下,CYTOSCAPE导出的png文件像素比较低,如果大家想要高清图片的话可以选择导出pdf文件,然后再转换为其他格式就好啦~    
           

 

那么今天的分享就到这里啦,是不是非常详尽呢~这么方便的一站式网络药理学分析平台小伙伴们快去抓紧时间上手吧!!!比起自己研究代码,不断debug,有这么一种好用的一站式工具平台不是很香嘛!不过话说回来,果叔开发的一站式生信工具也是非常方便快捷、毫不逊色哦~(http://www.biocloudservice.com/home.html)小伙伴们如果在平时的生信学习中遇到了什么不懂的问题欢迎大家随时来找果叔哦~果叔在生信耕耘十余年,非常乐意帮助生信路上新的小伙伴们~那么我们下一次再见啦~

果叔还提供思路设计、定制生信分析、文献思路复现;有需要的小伙伴欢迎直接扫码咨询果叔,竭诚为您的科研助力!


定制生信分析

服务器租赁

扫码咨询果叔


往期回顾

01

“made in China”嘎嘎好用!中国人自己的数据库就是香!暨南大学:CHARLS+Cox回归分析,8.5分信手拈来超牛!

02

IF=11.4南京医科大“本科生一作”发中科院1区,后浪真的强啊!预后模型纯生信分析还能发11分,得好好看看怎么做的~

03

IF=58.7,这泼天的多组学富贵可得接住!系统生物学研究团队开挂思路,机器学习助力个性化医疗,你就学吧,一看一个不吱声!

04

水刊拒稿莫慌,也许是 “福” 从天降!Heliyon on hold不打紧,转投1区神刊,力挽狂澜斩获6分+!



生信果
生信入门、R语言、生信图解读与绘制、软件操作、代码复现、生信硬核知识技能、服务器等
 最新文章