干货！快进来看看！motifStack包，序列logo定制的艺术大师！！体验科学研究的视觉盛宴！

学术 2024-10-07 19:00 上海

大家好，果叔来啦，很高兴又和大家见面了！今天我们要学习的是一个非常有用的R包——motifStack。motifStack包专门用于绘制和可视化DNA、RNA和蛋白质序列的基序，通过它我们可以生成高质量的序列logo图，帮助我们直观地展示序列中各个位置的碱基或氨基酸的保守性和频率分布。没有任何生信分析能难倒生信高手果叔，要是同学们有自己做不了的生信分析，欢迎随时联系我！！！

在今天的课程中，我将详细讲解如何安装motifStack包，并演示如何使用它来绘制丰富多彩的DNA序列logo。我们会从包的基本安装开始，逐步介绍如何载入数据、绘制序列logo，并展示如何调整绘图参数以及添加注释标记，使得图形更加美观和信息丰富。相信通过今天的学习，大家一定能够掌握motifStack包的基本用法，并在自己的研究中灵活应用。那就让我们正式开启motifStack包的学习之旅吧！

本次介绍的R包需要较多的硬件资源，在服务器可以更加流畅运行，同学们如果没有自己的服务器欢迎联系我们进行服务器租赁~

跑代码时卡顿、电脑不给力让人抓狂！找大侠试用稳定高速的服务器，让分析顺畅无比！

代码学不会？bug 频繁出现，束手无策？实操生信分析课程赶快学起来！滴滴果叔领取体验课程哦~

线上课程教学

课题设计、定制生信分析

云服务器租赁

加微信备注99领取使用

motifStack介绍

motifStack是一个专门用于绘制和可视化DNA、RNA和蛋白质序列基序的R包。它能够生成高质量的序列logo图，这些图可以帮助同学们直观地展示序列中各个位置的碱基或氨基酸的保守性和频率分布。motifStack包支持多种配色方案和字体，用户可以根据需要自定义图形的外观。此外，它还提供了添加注释标记的功能，使得序列logo图更具信息性和可读性。通过motifStack包，研究人员能够更加方便地进行序列分析和结果展示，提升数据可视化的效果和研究的直观性。

motifStack包的安装

需要R语言版本为4.3，在控制台中输入以下命令：

if (!require("BiocManager", quietly = TRUE))    install.packages("BiocManager ")BiocManager::install("motifStack") # 在BiocManager环境下安装motifStack    查看是否安装成功packageVersion("motifStack") # 查看motifStack版本

显示为1.46.0版本，则表示已经安装了motifStack包。

成功安装motifStack包后，我们接下来将演示如何使用motifStack包来绘制丰富多彩的序列LOGO(sequence logo)，果叔会讲的很仔细，同学们可要认真听讲哦。

使用motifStack包绘制DNA序列logo示例

包和数据载入：

进行DNA序列logo绘制，我们首先需要载入需要用到的包和数据，本篇文章演示为了让同学们更容易理解，将只采用motifStack包自带的数据集，同学们如果需要完成自己数据DNA序列logo绘制，进行对应的替换即可，相关命令如下：

# 导入motifStack包，该库用于操作和可视化基序（motif）library(motifStack)# 读取包含位置权重矩阵（position count matrix，PCM）的文本文件# 使用find.package函数找到motifStack包的安装路径，并构建文件路径    pcm <- read.table(file.path(find.package("motifStack"),                            "extdata", "bin_SOLEXA.pcm"))# 去除数据框的前两列，只保留第三列及其后的列pcm <- pcm[,3:ncol(pcm)]# 设置数据框的行名，代表碱基A、C、G、Trownames(pcm) <- c("A","C","G","T")# 查看处理之后的pcm数据框pcm

结果显示如上图，可知共有1068个序列的七个位点信息，其中列为序列中的DNA位点，行为碱基，单元格为该碱基在对应位点出现的次数。接下来我们可以构建一个pcm（position count matrix，位置权重矩阵）对象来绘制对应序列的logo，相关命令如下：

# 创建一个新的pcm对象，使用as.matrix将数据框转换为矩阵# 将矩阵存储在motif对象的mat属性中，并设置motif对象的名称为"bin_SOLEXA"motif <- new("pcm", mat=as.matrix(pcm), name="bin_SOLEXA")    # 绘制motif对象plot(motif)

显示如上图，即成功绘制了示例数据DNA的序列logo，从图中我们可知2-7号位点相对保守，可能是与DNA功能相关的一些重要位点。接下来我们还可以对绘制序列logo的参数进行调整，让图像更加美观，满足不同研究的需求。

绘制参数调整

我们可以对plot的参数进行相应的调整，来获得我们想要的效果，例如让y轴标为碱基的概率分布，代码如下：

#绘制碱基概率分布的DNA序列logoplot(motif, ic.scale=FALSE, ylab="probability")

改变x轴为自定义刻度，代码如下：

#绘制自动x轴刻度的DNA序列logoplot(motif, xaxis=paste0("pos", seq.int(7)+10))

自定义配色方案和字体，代码如下：

#绘制指定配色方案和字体的DNA序列logomotif@color <- colorset(colorScheme='basepairing')plot(motif,font="serif")

对于DNA 和 RNA可用的配色方案有'auto', 'basepairing', or 'blindnessSafe'，可用的字体有'sans'，'serif'，'mono'，'Helvetica' 等绘图常用字体。

添加注释标记

想要让DNA序列logo更加直观易懂，除了对于plot()函数的基础参数调整外，我们还可以直接在logo图上添加marker标记，相关代码如下：

# 创建一个矩形标记对象，标记从第6到第7位，设置为虚线边框，橙色，无填充markerRect <- new("marker", type="rect", start=6, stop=7, gp=gpar(lty=2, fill=NA, col="orange"))    # 创建一个线条标记对象，标记从第2到第7位，设置为红色，线宽为2markerLine <- new("marker", type="line", start=2, stop=7, gp=gpar(lwd=2, col="red"))# 创建一个文本标记对象，标记第1和第5位，设置为红色，字体大小为2，文本标签为“*”和“core”markerText <- new("marker", type="text", start=c(1, 5),                  label=c("*", "core"), gp=gpar(cex=2, col="red"))# 构建一个新的pcm对象，并且添加markerRect, markerLine, markerText三个注释。motif <- new("pcm", mat=as.matrix(pcm), name="bin_SOLEXA",             markers=c(markerRect, markerLine, markerText))#绘制motif对象plot(motif)

在数据可视化中，尤其是生物信息学中的序列logo绘制时，添加注释标记能够极大地提升图形的直观性和信息量。如图所示，代码分别创建了一个矩形标记对象，标记从第6到第7位，设置为虚线边框，矩形标记常用于强调某些关键区域，比如在DNA序列中标注重要的保守区域、功能域或结构域。一个线条标记对象，标记从第2到第7位，设置为红色，线宽为2，线条标记可以用来表示某些功能元件的范围，比如基因调控元件、蛋白质结合位点等。一个文本标记对象，标记第1和第5位，设置为红色，字体大小为2，文本标签为“*”和“core”，文本标记可以用于标注关键位点，比如突变位点、结合位点等，提供详细的注释信息。通过将矩形标记、线条标记和文本标记添加到绘制的DNA 序列logo上，可以显著提升序列logo的直观性和信息丰富度。这些标记不仅能够强调重要区域和位点，还能通过详细的注释使得图表更加易于理解和解释，对于同学们进行科学研究和成果展示有着重要的意义。

以上，就是对motifStack包的全部介绍了。果叔希望同学们通过本文的学习，能够掌握motifStack包的基本用法，并能在自己的研究中灵活应用，继续探索和学习更高级的功能，提升自己的数据可视化能力。如果需要更多帮助或硬件支持，欢迎联系我们。祝同学们学习愉快！

同学们如果觉得自己写代码麻烦，可以体验一下我们的云生信小工具，只需输入数据，即可轻松生成所需图表。立即访问云生信（http://www.biocloudservice.com/home.html），开启便捷的生信之旅！

微信加群

为促进前沿研究的传播和交流，我们建立了专业交流群，长按下方二维码，即可添加小编微信进群，添加微信时请备注：学校/专业/姓名，如果是PI/教授，还请注明。

果叔还提供思路设计、定制生信分析、文献思路复现；有需要的小伙伴欢迎直接扫码咨询果叔，竭诚为您的科研助力！

定制生信分析

服务器租赁

扫码咨询果叔

往期回顾

IF:18.8!这套思路转化价值极高！深度学习+多模态数据+生物标志物，正成为国自然临床口子新宠，原来可以做这么多方向！

国产一区7分“神刊”，多领域沾边就收，纯生信文章超香，看这篇示例就懂！！

恭喜拿下一区8.5分！电子科大绵阳中心医院借MIMIC数据库之力发文，「TyG 」真就高分敲门砖呗！

“顶刊中的小弟，水刊中的大哥”说的就是Nature Communications！杭师大团队靠UKB数据库，简简单单5张图搞定！

http://mp.weixin.qq.com/s?__biz=Mzg3OTg3MjQyNg==&mid=2247504109&idx=2&sn=08e28b8191a842522652046a1a9baf18

生信果

生信入门、R语言、生信图解读与绘制、软件操作、代码复现、生信硬核知识技能、服务器等

样本量爆棚？分析深度加码？选对服务器，省心科研无忧！

UKB数据库真的牛！3天接受，10天发表！免费新数据绝佳发文时期，拼的就是手速！仅2张图就能拿下IF:13.4分？！

Nature Methods佳作！双注意力机制新型图神经网络SpatialGlue破译空间多组学的空间域

基于机器学习识别潜在疾病生物标志物，5分超级易复现！就是这么简单！（附十大机器学习库，超全速码~）

网络药理学大神进阶！筛选PPI网络，给你的论文”精装修“,再也不被期刊卡图！

16.6分亮相！重医团队推出：孟德尔随机化数据库DMRdb，专治不会MR的你，“医” 路畅通无阻！保姆级别的教学，还不快码住！

网络药理学大神进阶！筛选PPI网络，给你的论文”精装修“,再也不被期刊卡图！

IF=11.4南京医科大“本科生一作”发中科院1区，后浪真的强啊！预后模型纯生信分析还能发11分，得好好看看怎么做的~

当实验无趣时：如何通过租赁服务器开启科研新篇章

水刊拒稿莫慌，也许是 “福” 从天降！Heliyon on hold不打紧，转投1区神刊，力挽狂澜斩获6分+！

空间转录组学数据处理只依赖R语言？让我们从scanpy开始，拥抱python吧！

IF 27.7！TCGA+GTEx老树开花，纯生信轻松卷上Mol Cancer！不是实验做不起，而是纯生信更有性价比！

IF=58.7，这泼天的多组学富贵可得接住！系统生物学研究团队开挂思路，机器学习助力个性化医疗，你就学吧，一看一个不吱声！

没听错吧！单细胞中也可以进行免疫浸润分析？SpatialCells带给你新的体验！

当实验无趣时：如何通过租赁服务器开启科研新篇章

“made in China”嘎嘎好用！中国人自己的数据库就是香！暨南大学：CHARLS+Cox回归分析，8.5分信手拈来超牛！

目标达成！服务器独享拼团，优惠力度超乎想象！

羡慕了！不做实验照样高分 “开挂”！中南大学雷光华团队玩转MR，3表2图成就1区7.6分佳绩！纯生信发文妙招你悟了吗？！

没听错吧！单细胞中也可以进行免疫浸润分析？SpatialCells带给你新的体验！

0实验，10天见刊？中国医科大学团队1区：“机器学习+GEO数据库”入门级分析，也能轻松拿捏6分SCI！复现赶紧速速走起！

26天接收？又快又“水”的救命神刊！不信看山东中医药大学的这篇“网络药理学”佳作，看了的人都说发文so easy！

目标达成！服务器独享拼团，优惠力度超乎想象！

IF=13.0!又被孟德尔随机化给“秀”到了！复旦大学郁金泰团队挖掘UKB数据库，仅5张图拿下高分！

IF 27.7！TCGA+GTEx老树开花，纯生信轻松卷上Mol Cancer！不是实验做不起，而是纯生信更有性价比！

BIG胆！研究生“豪横”放7天，导师灵魂拷问：几篇SCI就敢浪？10月新增的这几本On hold期刊别说不知道！

干货！快进来看看！motifStack包，序列logo定制的艺术大师！！体验科学研究的视觉盛宴！

机器学习当真是牛哄啊！这谁能想到2024诺贝尔物理学奖竟颁给了交叉学科，速看官方如何“狡辩”！

果叔手把手带你复现XGboost和LightGBM机器学习算法特征重要性排名和 SHAP 汇总图

有这思路，复现爽歪歪！扬州大学团队1区7+：“网络药理学+分子对接+分子动力学”三连击，毕业so easy！

目标达成！服务器独享拼团，优惠力度超乎想象！

网药惊喜！17天接收，速度 “飞” 天！毕业神刊加持，网药+分子对接+分子动力学，2区稳稳哒，中医药学子赶紧的冲！

干货！快进来看看！motifStack包，序列logo定制的艺术大师！！体验科学研究的视觉盛宴！

这就是咱们国人之光哇！同济医院骆翔团队以 “UKB 数据库+孟德尔随机化” 斩获一区5分，试问实验还卷得动吗？

果叔教你使用spatialLIBD语言包分析生物空间数据

IF 27.7！TCGA+GTEx老树开花，纯生信轻松卷上Mol Cancer！不是实验做不起，而是纯生信更有性价比！

心脏警报，摆烂的年轻人注意了！北大团队10万国人研究：不健康生活方式让冠心病风险激增，你还敢任性吗？

不会在服务器使用百度网盘？bypy来帮你

目标达成！服务器独享拼团，优惠力度超乎想象！

我缺的是Nature Communications吗？我缺的是能上顶刊的创新思路！中山大学巨噬细胞携手胞葬作用登顶NC！

牛掰啊！本科生一作0实验发Top纯生信！“代谢重编程+机器学习”就这点东西做完直接毕业！

浙江大学研究团队发文有高招！“单细胞+空转+巨噬细胞”这个“王牌套路” 学会，发它个10篇，普通青椒/医生晋升的路这不就通了吗！

这是咱们国人的杰作啊！同济医院骆翔教授团队利用“UKB数据库+孟德尔随机化”顺利收获一区5分，有这思路还卷什么实验啊！

从前对“网络毒理学”爱答不理，如今高攀不起！0实验成就海南医科大学团队6分+文章，新赛道就是发文福地，易复现，转头又是一篇！

从临床到生信：医生们 “躺平式” 发文新打法，干湿结合的侧重点该如何把握？

IF 27.7！TCGA+GTEx老树开花，纯生信轻松卷上Mol Cancer！不是实验做不起，而是纯生信更有性价比！

从前对“网络毒理学”爱答不理，如今高攀不起！0实验成就海南医科大学团队6分+文章，新赛道就是发文福地，易复现，转头又是一篇！

目标达成！服务器独享拼团，优惠力度超乎想象！

刚复现的生信文章投稿被拒？别慌！这一文了解常见拒稿原因及应对策略，实测有效！

牛掰啊！本科生一作0实验发Top纯生信！“代谢重编程+机器学习”就这点东西做完直接毕业！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉