0基础，3个月，发5+SCI？手把手教学零代码复现，这样发生信简直太香了！

学术 2024-10-10 16:30 上海

欢迎来到雪梨的复现妙妙屋~诺奖吃瓜虽精彩，生信基础别掉队。今天菠萝作为暂代主持人，介绍一篇研究非肿瘤疾病关键基因和免疫浸润的文章（IF=5.7）复现方法，大家也可以自主思考一下，诺贝尔奖热点——机器学习、蛋白质分子结构预测等方法怎样应用到我们自己的文章中。有任何问题欢迎留言，或添加雪球老师直接询问~

分析工具不会用？

初学代码总卡顿？

服务器带不动高通量数据分析？

添加雪球老师

回复“个性化”获得陪跑发文丝滑体验

全文共10图2表，我们今天先来学习前5张图的复现。

Key genes and immune infiltration in chronic spontaneous urticaria: a study of bioinformatics and systems biology

慢性自发性荨麻疹的关键基因和免疫浸润：生物信息学和系统生物学研究

期刊：Frontiers in Immunology

IF：5.7

发布时间：2023/11/15

套路：非肿瘤

数据来源：GSE57178，GSE72540数据集

技术路线：

从GEO数据库下载GSE57178 和 GSE72540数据集→对GSE52093 和 GSE72540数据集进行差异分析，通过火山图形式可视化分析结果→利用STRING数据库构建差异基因的PPI网络图→绘制差异基因热图→GSEA富集分析→利用David数据库和Metascape数据库对差异基因进行生物过程富集分析→利用Funrich、软件对差异基因进行生物途径富集分析→利用Cytoscape软件的Mcode插件生成基因模块并进行通路富集分析→利用Cytoscape软件的cytoHubba插件筛选hub基因并进行互作网络分析→对两个数据集进行免疫浸润分析→对hub基因进行免疫浸润相关性分析探究hub基因与免疫细胞的相关性

分析工具：

仙桃学术（https://www.xiantaozi.com/）（新版）各种生信分析工具

GEO数据库（https://www.ncbi.nlm.nih.gov/geo/）

GEO数据集下载

STRING数据库（https://string-db.org/）

构建PPI网络

CytoScape软件及其插件

PPI网络可视化及各种分析

NetworkAnalyst数据库(https://www.networkanalyst.ca/NetworlKAnalyst/)

疾病关联和药物互作分析

David数据库(https://david.ncifcrf.gov/summary.jsp)

生物过程富集分析

Metascape数据库(https://metascape.org/gp/index.html#/main/step1)

生物过程富集分析

FunRich软件(下载：http://www.funrich.org/)

生物途径富集分析

Figure 1 差异表达基因分析

Figure 2 差异基因热图

Figure 3 GSEA富集分析

Figure 4 DAVID和Metascape富集分析

Figure 5 Funrich富集分析

复现流程

*友情提示：

请及时保存分析结果并合理命名文件！

Figure 1

差异表达基因分析

Figure 1A

*包含使用仙桃进行缺失值过滤和数据去重的逐步教学

在GEO数据库中下载GSE57178数据集的表达矩阵。

新建一个excel命名为【GSE57178】，提取出表达矩阵。

在GEO数据库中通过GEO2R获取探针的Symbol ID。

新建一个excel命名为【ID1】，提取出“ID”列和“Gene.symbol”列。

对【GSE57178】按第一列“ID_REF”升序进行排序，对【ID1】也按第一列“ID”升序进行排序，然后将【ID1】中“Gene.symbol”列替换【GSE57178】中“ID_REF”列，完成探针合并。将列名“Gene.symbol”改成“Symbol”，并另存为一个excel命名为【exp1_pre】。

进入仙桃网站，选择【生信工具】，在左侧的【其他】中选择我们需要用到的【缺失值过滤】。

上传【exp1_pre】，点击【验证】。“过滤类型”选择“过滤掉特定缺失及以上个数”，“特定个数”填“1”，然后点击【确认】。

点击【数据缺失值过滤结果.csv】下载过滤结果。

进入仙桃网站，选择【生信工具】，在左侧的【其他】中选择我们需要用到的【数据去重】。

上传【数据缺失值过滤结果】，点击【验证】。然后点击【确认】。

点击【数据去重.csv】下载去重结果，并重新命名为【exp1】，即为GSE57178数据集表达谱。

在GEO数据库中提取GSE57178数据集的分组信息，保存到一个新的excel【group】中。

进入仙桃网站，选择【生信工具】，在左侧的【差异表达】中选择我们需要用到的【芯片数据-差异分析】。

上传表达谱和分组信息，点击【验证】。“参考组选择”选择“HC”，点击【确认】。

在【历史记录】中点击【差异分析.xlsx】，下载差异分析结果。

新建一个excel命名为【火山图】，将【差异分析】中的“id”，“logFC”和“P.Value”列复制到【火山图】中，并将“P.Value”改为“pvalue”。

进入仙桃网站，选择【生信工具】，在左侧的【差异表达】中选择我们需要用到的【火山图】。

上传火山图数据，点击【验证】。

修改【主要参数】，点击【确认】。

出图后可以根据需要保存相应格式的文件(如pdf、tiff等)。

在【差异分析】中按照|“logFC”列|>1，“P.Value”列<0.05，筛选差异表达基因，并将筛选到的差异基因复制到一个新的excel【sig1】中，列名为“GSE57178”。

Figure 1B复现步骤与Figure 1A类似，将数据集GSE57178替换成数据集GSE72540即可，完成后也可以得到【sig2】用做后续分析。

Figure 1C

新建一个excel命名为【韦恩图】，将【sig1】中的“GSE57178”列和【sig2】中的“GSE72540”列复制到【韦恩图】中并保存。

进入仙桃网站，选择【生信工具】，在左侧的【基础绘图】中选择我们需要用到的【韦恩图】。

上传韦恩图数据，点击【验证】，然后点击【确认】。

出图后可以根据需要保存相应格式的文件(如pdf、tiff等)。

点击【交集情况.xlsx】下载交集基因。

Figure 1D

在STRING数据库(https://cn.string-db.org/)网站中选择Multiple proteins，输入所有的交集基因，然后点击

【SEARCH】。

点击【CONTINUE】。

使用默认参数，点击【Exports】，下载第四个.tsv格式的数据。

新建一个excel命名为【updown】，第一列为交集基因，第二列为基因的上下调情况。

打开Cytoscape软件，选择“Import Network from File System”，上传刚才下载的数据，点击【OK】。

选择“Import Table from File”，上传交集基因的上下调分组数据，点击【OK】。

点击【Tools】-【Analyze Network】-【OK】。

点击【Style】，“Fill Color”选择“group”，“shape”选择“圆形”，“Size”选择“TopologicalCoefficient”，点击“Lock node width and height”，根据需要调整样式。

调整好之后选择【Exportas Image】保存为.png或其他格式。

Figure 2

差异基因热图

Figure 2A

进入仙桃网站，选择【生信工具】，在左侧的【其他】中选择我们需要用到的【数据提取】。

上传GSE57178表达谱数据，点击【验证】。“类型”选择“下面特定变量”，将交集基因复制到“特定变量”框中，点击【确认】。

点击【提取数据.csv】下载提取结果。

在第一行添加一行分组，行名为#group，然后另存为一个新的csv文件命名为【GSE57178热图】。

进入仙桃网站，选择【生信工具】，在左侧的【表达差异】中选择我们需要用到的【简易数值热图】。

上传热图数据，点击【验证】。

修改【主要参数】，然后点击【确认】。

出图后可以根据需要保存相应格式的文件(如pdf、tiff等)。

Figure 2B复现步骤与Figure 2A类似，将数据集GSE57178替换成数据集GSE72540即可。

Figure 3

GSEA富集分析

Figure 3A

将之前得到的GSE57178【差异分析】中“id”列和“logFC”列复制到一个新的excel【GSE57178GSEA】中，并将“logFC”改为“value”。

进入仙桃网站，选择【生信工具】，在左侧的【功能聚类】中选择我们需要用到的【[GSEA] 富集分析】。

上传GSE57178数据，点击【验证】。“基因集”选择“Hallmarks”基因集，点击【确认】。

在【历史记录】中，点击【GSEA.xlsx】下载GSEA富集分析结果。

进入仙桃网站，选择【生信工具】，在左侧的【功能聚类】中选择我们需要用到的【[GSEA] 经典可视化】。

自动上传了刚刚GSEA富集分析的结果，在“ID列表”输入想要展示的通路名称，然后点击【确认】。

出图后可以根据需要保存相应格式的文件(如pdf、tiff等)。

Figure 2B复现步骤与Figure 2A类似，将数据集GSE57178替换成数据集GSE72540即可。

Figure 4

DAVID和Metascape富集分析

Figure 4A

在David数据库(https://david.ncifcrf.gov/summary.jsp)网站中输入所有的交集基因，选择“OFFICIAL_GENE_SYMBOL”和“Homo sapiens”，选择“Gene List”，最后点击【Submit List】进行富集分析。

点击【Gene_Ontology (3 selected)】，然后点击【Chart】下载BP富集分析结果。

点击【Download File】下载分析结果并保存到一个新的excel【David_bp】中。

将第二列“Term”分列，得到“BP”列，并且添加两个新的列“-LOG10(Pvalue)”和“P=0.05 reference”。“-LOG10(Pvalue)”列的值为对“PValue”列取负对数，“P=0.05 reference”列的值为-log10(0.05)。

选中“BP”，“Count”，“-LOG10(Pvalue)”和“P=0.05 reference”列前10行数据，点击【二维柱形图】。

生成图表以后，右击图表，点击【更改图表类型】。点击【组合图】，根据需求调整图表类型，然后点击【确定】。

出图后将标题改为“Biological Processes (BP)”，然后可以根据需要保存相应格式的文件(如png、tiff等)。

Figure 4B

在Metascape(https://metascape.org/gp/index.html#/main/step1)网站中，输入所有的交集基因，点击【Submit】。“Input as species”选择“H. sapiens”，然后点击“Custom Analysis”。

点击【Enrichment】，选择“GO Biological Processes”，然后点击【Enrichment Analysis】。

出图后可以根据需要保存相应格式的文件(如pdf等)。

Figure 5

Funrich富集分析

在FunRich官网（http://www.funrich.org/）下载FunRich软件。

点击【Add dataset】。

输入所有交集基因，然后点击【OK】。

点击【Gene enrichment】-【Analysis】。

使用默认的数据集，点击【OK】。

点击【Save Chart】保存图片。

恭喜你完成前半部分复现！在后半部分中，我们会继续学习差异基因的通路富集分析、Hub基因互作网络分析，以及免疫浸润分析的操作。想要学习全文完整复现，记得点击星标，每日更新不错过！

利用在线工具零代码进行生信分析，能够轻松出结果的同时，在常见疾病中往往面临一定的发文上限。想要争取更高分数SCI发表，又没有时间系统学习R语言的朋友们可以添加雪球老师好友，回复“个性化”帮你调研创新方向，提升文章上限，达成发文小目标！2024年余额不多了，有任何生信学习和SCI发表的问题，有任何想加速完成的科研目标，都可以和雪球老师聊一聊~

添加雪球老师微信

回复“个性化”

定制陪跑安心发文

都看到这里了，点个星标再走吧！

听说不点星标，容易错过最新资讯！

http://mp.weixin.qq.com/s?__biz=MzAwMjY4MDE2Mg==&mid=2247646901&idx=1&sn=a0f20b82a254f0171762f26354ff3a64

挑圈联靠

关注挑圈联靠，生信全知道。小白生信作图，看挑圈联靠；不会写R代码，看挑圈联靠；数据库不会用，看挑圈联靠。

最新文章

阿尔茨海默新发现！研究发现：AD进展中神经元与胶质细胞的惊人协同变化！

太牛了！5分钟Get国自然完整标书！学会这个工具，2025国自然赢在起跑线！

哭死！医院新规：入职3年内拿不到国自然将自动解聘……普通医生还能有出路吗？

重磅！面上基金取消 “报二停一” 政策，申请人数激增，普通医生如何破局？

【必备实验知识库】高通量技术、PCR、qPCR、Western blot、RNAi/CRISPR、检测常见表型......

生信SCI越来越难发？！拉上这个“小伙伴”，苛刻的编辑都不会拒稿......

爆火！某三甲医院特殊门诊刚开诊就被全部约满！医生：这种情况真别来！

速看！4小时写完初稿，这才是真正的论文神器!(含教程)

IF=98.4！Meta分析强势登顶Lancet！中科院一区！医学生直呼太牛了……

某三甲医院医生国自然连续陪跑6年，眼看要被医院辞退，竟靠生信逆风翻盘！

破解核心期刊“潜规则”：9大策略助你轻松提升论文接受率！

多本神刊On Hold，着急毕业选哪家？拿好这份2区最新潜力神刊清单，第一篇SCI也可以很体面！

窒息！三甲医院奇葩规定！没有国自然，不给评职！？全体主治沉默了……

IF=98.4！Meta分析强势登顶Lancet！中科院一区！医学生直呼太牛了……

吹爆！这个写作神器太好发综述了，忍不住安利……

太顶了！Wnt、Notch、NF-κB、MAPK等明星通路的普遍规律、筛选策略全都知道！（快收藏）

2025年，国自然申请的“黄金机遇”：科研人员如何把握政策红利与资助新机遇？

2区6+TopSCI拆解，孟德尔+单细胞+网络药理学，科研这么做，就像“玩乐高”！

14.5分一区！中山大学团队免疫学领域最新发文！高分文章都在做细胞实验……

零代码就可以做孟德尔随机化！这个生信神器可以一键式操作！太绝了！

刚刚！某37岁主治医因被外放愤怒辞职！没想到1个月后，科主任给他频繁发消息……

IF=14.7分！南方医科大学重磅论文！MAPK信号通路这么做能发一区！

人到博三，我还没变，别人对我的期待已经变了

今年已经要火的10+思路这么容易复现！同款高分赶紧发吧，晚了又得卷！

吹爆！这个写作神器太好发综述了，忍不住安利……

IF40+ 院士团队重磅综述登上一区顶刊！原来优秀的综述都是这么写.........

IF=8.2，谁说生信上不了桌？浙大团队用“单细胞+空间转录组+巨噬细胞”，轻松卷上1区

0实验、无病例发文资料来了！全网最全、持续更新孟德尔随机化知识库！50＋问答视频让你轻松拿下1区SCI！

提前布局！国自然标书初稿如何助你提升中标率，11月备战不再迟疑！

专治期刊选择困难症！网药+生信遇上这几个期刊，投就完事了！

“工作量再多也上不了10+？”恰恰相反！10+SCI当红思路MR+多组学，数据集怎么选看这一篇就够了！

太顶了！Wnt、Notch、NF-κB、MAPK等明星通路的普遍规律、筛选策略全都知道！（快收藏）

哭了！研一医学生综述写的太烂被骂到失眠，这个工具简直是“雪中送炭”……

师妹被网上的protocol坑了无数次，中科院博士亲自带领做实验，实验超详细讲解来了！

想成为生信高手吗？照这个“生信秘籍”修炼，5分+SCI即刻收入囊中！

2025国自然时间表出炉！看看你的进度如何？

“别肝论文了！用好AI，20分钟就能完成！”与同行聊天记录曝光后，网友都看傻了！

太老实的人发不出SCI？复旦中山博士：找对方法，SCI真不难...

顶级三甲华西发文！只看分级，不看IF分值？这篇IF40.8的高质量综述review有多能打？！

“水刊拒稿，焉知非福？”Heliyon on hold又何妨？转投1区神刊，发6+高分好刊！

【必备实验知识库】高通量技术、PCR、qPCR、Western blot、RNAi/CRISPR、检测常见表型......

孟德尔随机化风靡三甲医院！学会这一招，普通医生也可冲5分SCI！

某双非医学生上岸985后，没想到被导师强制要求帮写国自然！结果他偷偷用AI帮写……

2025国自然时间表出炉！看看你的进度如何？

“看似简单”的科研：探讨套路背后的深层思考与真实挑战

0基础，3个月，发5+SCI？手把手教学零代码复现，这样发生信简直太香了！

想成为生信高手吗？照这个“生信秘籍”修炼，5分+SCI即刻收入囊中！

哭了！综述写的太烂被导师骂了一个小时，这份综述教程简直是“雪中送炭”……

哭了！研一医学生综述写的太烂被骂到失眠，这个工具简直是“雪中送炭”……

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉