R语言小白绘图系列·第33弹|离散变量生存曲线

文摘 2024-07-22 00:48 德国

R语言小白绘图系列

第33弹

离散变量生存曲线

离散变量生存曲线简介

离散变量生存曲线（Discrete Variable Survival Curve）是一种用于分析和展示生存数据的方法，特别适用于离散型变量。离散变量是指只能取特定值的变量，例如性别（男、女）、治疗组（对照组、实验组）等。

离散变量生存曲线的基本概念

生存分析：用于处理时间到事件的数据，例如患者从治疗开始到疾病复发的时间，或者从手术到死亡的时间。生存分析的核心在于分析时间和事件之间的关系。
生存函数（Survival Function, S(t)）：描述在时间 ( t ) 之后个体仍然存活的概率。数学上表示为 ( S(t) = P(T > t) )，其中 ( T ) 是生存时间。
离散变量：生存分析中可以根据离散变量（如治疗组、性别等）将数据分组，对每个组分别绘制生存曲线。

应用场景

临床试验：比较不同治疗方案的效果。
流行病学研究：分析不同人群的生存率。
工程领域：评估设备或系统的寿命。

离散变量生存曲线在各个领域都有广泛应用，能够帮助研究人员理解和比较不同组别的生存情况，从而提供重要的决策支持。

应用实例

下图是以分期为变量（见图例），比较不同分期之间的生存率是否具有差异；横坐标代表生存时间，单位是年；纵坐标代表生存率；通过P值可以了解不同分期之间生存率是否存在差异，若p<0.05则说明不同分期的生存率存在差异；如下图，p<0.001,Ⅰ期的生存率最高，Ⅳ期生存率最低。

源文件

输入文件有四列信息

id: 样品名称

futime:生存时间，单位为年。

fustat:生存状态，0代表存活，1代表死亡。

离散变量：分期、性别、年龄分组等

代码

环境准备

这段代码设置了用于生存分析的基本环境，包括安装必要的包、加载包、设置输入输出文件和变量，以及设置工作目录。以下是逐行解释：

# 安装必要的包
#install.packages("survival")
#install.packages("survminer")

这两行代码用于安装survival和survminer包。如果已经安装过，可以跳过这一步。这两行代码目前被注释掉了，如果需要安装这些包，可以去掉注释。

# 引用包
library(survival)
library(survminer)

这两行代码用于加载survival和survminer包，这两个包是进行生存分析和生存曲线可视化的常用包。

inputFile = "input.txt"
outFile = "survival.pdf"

这两行代码定义了输入文件名为"input.txt"，输出文件名为"survival.pdf"。

var = "Stage"  # 用于生存分析的变量

这行代码定义了用于生存分析的变量为"Stage"，表示将使用输入数据中的Stage列进行分析。

setwd("D:\\biowolf\\bioR\\34.survivalDiscrete")  # 设置工作目录

这行代码设置当前工作目录为"D:\\biowolf\\bioR\\34.survivalDiscrete"。

数据准备

下面这段代码用于读取输入数据文件，并准备进行生存分析的数据。以下是逐行解释：

# 读取数据
rt = read.table(inputFile, header = TRUE, sep = "\t", check.names = FALSE)

这行代码读取制表符分隔的输入文件，并将其内容存储到数据框rt中。header = TRUE表示文件的第一行是列名，check.names = FALSE表示不自动修改列名。

rt = rt[, c("futime", "fustat", var)]

这行代码选择数据框rt中的三列进行分析：生存时间（futime）、生存状态（fustat）和变量var（在之前定义的变量）。这里假设输入数据文件中包含这些列。

colnames(rt)[3] = "Type"

这行代码将第三列的列名改为"Type"，这样在后续分析中可以更容易引用该列。

groupNum = length(levels(factor(rt[,"Type"])))

这行代码计算"Type"列中的不同组数，并将其存储在变量groupNum中。factor(rt[,"Type"])将"Type"列转换为因子，然后levels函数返回因子的水平，length函数计算水平的数量。

总结来说，这段代码的目的是读取输入数据文件，选择需要进行生存分析的列，并准备数据框进行分析。同时，它还计算了用于分析的分组数目。

比较组间生存差异的P值

这段代码用于比较不同组间的生存差异，并计算相应的p值。以下是逐行解释：

diff = survdiff(Surv(futime, fustat) ~ Type, data = rt)

这行代码使用survdiff函数计算不同组间的生存差异。Surv(futime, fustat)创建一个生存对象，其中futime是生存时间，fustat是生存状态（事件发生为1，未发生为0）。~ Type表示按Type变量分组，data = rt指定数据来源。

pValue = 1 - pchisq(diff$chisq, df = (groupNum - 1))  # df自由度

这行代码计算卡方检验的p值。diff$chisq是survdiff计算的卡方值，df = (groupNum - 1)是自由度，自由度等于组数减1。pchisq函数返回卡方分布的累积分布函数值，1减去该值即为p值。

if(pValue < 0.001) {
  pValue = "p<0.001"
} else {
  pValue = paste0("p=", sprintf("%.3f", pValue))
}

这段代码格式化p值。如果p值小于0.001，则将其表示为"p<0.001"；否则，将其格式化为小数点后三位并转换为字符串。

fit <- survfit(Surv(futime, fustat) ~ Type, data = rt)

这行代码使用survfit函数根据Type变量分组拟合生存曲线。Surv(futime, fustat)创建生存对象，~ Type表示按Type变量分组，data = rt指定数据来源。fit对象包含生存曲线拟合的结果。

总结来说，这段代码的目的是计算不同组间的生存差异的p值，并拟合生存曲线。

绘制生存曲线

这段代码使用ggsurvplot函数绘制生存曲线，并将结果保存到PDF文件中。以下是逐行解释：

surPlot = ggsurvplot(fit, 
                     data = rt,
                     conf.int = FALSE,  # 不显示置信区间
                     pval = pValue,  # 显示p值
                     pval.size = 5,  # p值字体大小
                     legend.labs = levels(factor(rt[,"Type"])),  # 图例标签
                     legend.title = var,  # 图例标题
                     xlab = "Time (years)",  # x轴标签
                     break.time.by = 1,  # x轴时间间隔
                     risk.table.title = "",  # 风险表标题为空
                     risk.table = FALSE,  # 不显示风险表
                     risk.table.height = .25)  # 风险表高度

这段代码使用ggsurvplot函数创建生存曲线图。参数解释如下：

fit: 使用survfit函数拟合的生存曲线对象。
data = rt: 用于绘图的数据。
conf.int = FALSE: 不显示置信区间。
pval = pValue: 显示p值。
pval.size = 5: 设置p值的字体大小。
legend.labs = levels(factor(rt[,"Type"])): 设置图例标签为Type变量的水平。
legend.title = var: 设置图例标题为变量名var。
xlab = "Time (years)": 设置x轴标签为“Time (years)”。
break.time.by = 1: 设置x轴时间间隔为1年。
risk.table.title = "": 设置风险表标题为空。
risk.table = FALSE: 不显示风险表。
risk.table.height = .25: 设置风险表的高度。

pdf(file = outFile, onefile = FALSE, width = 5, height = 4.5)

这行代码设置输出设备为PDF文件，文件名为"survival.pdf"，并指定PDF的宽度为5英寸，高度为4.5英寸。

print(surPlot)

这行代码将绘制的生存曲线图输出到PDF文件中。

dev.off()

这行代码关闭PDF设备，完成图形的保存。

总结来说，这段代码的目的是使用ggsurvplot函数绘制生存曲线，并将图形保存为PDF文件。

现在：

长按扫码关注：科研生信充电宝

5元赞赏本文，即喜欢作者~

即可直接解锁：

《R语言小白绘图系列·第33弹|离散变量生存曲线》哦~

您将获得示例输入文件和完整代码

看到这里你还不心动吗？

赶紧关注、转发、点赞、分享，领取你的专属福利吧~

好啦，以上就是今天推文的全部内容啦！

今天的分享就到这里啦~

另外，本公众号建立了R语言和Python学习分享群，联系后台小编，拉您入群。

如果您发现本公众号中有涉嫌抄袭的内容，欢迎发送邮件至：kysxcdb@163.com 进行举报，一经查实，本公众号将立刻删除涉嫌侵权内容。

http://mp.weixin.qq.com/s?__biz=MzkyODIyOTY5Ng==&mid=2247491910&idx=1&sn=b974eff265257c7f9be3f7ac8400a5fa

科研生信充电宝

介绍科研；介绍统计；介绍生信；

最新文章

R语言小白绘图系列|第39弹·多指标ROC曲线

祝贺同学中科院二区见刊：利用基于机器学习和深度学习的DLG3、RADL和病理组学签名预测乳腺癌患者的pCR和化学敏感性

R语言小白绘图系列|第38弹·极简ROC曲线

R语言小白绘图系列|第37弹·生存分析中的列线图和校准曲线

R语言小白绘图系列|第 36 弹·双基因生存曲线

R语言小白绘图系列|第35弹·连续变量生存曲线(最优cutoff)

计划扩大到1万人！中国科协青托博士生专项计划！

跟着高分SCI学作图： R语言森林图哪家强？

跟着高分SCI学画图：R语言绘制曼哈顿图

跟着高分SCI学画图：R语言绘制嵌套圈图

SCI高分秘籍：R语言绘制三线表

跟着高分SCI学画图：Python绘制六边形箱图和核密度估计图

跟着高分SCI学画图： R语言绘制甘特图

首次！博士生青年托举专项ta来了

跟着高分SCI学画图：R语言绘制弦图

重磅！2024年中华医学科技奖初审结果揭晓，139个项目通过公示！

跟着高分SCI学画图：R语言绘制全球色阶散点地图

周日训练营免费直播讲解--如何三天做一篇影像组学SCI：影像组学人工智能培训班+影像组学平台

警惕!知名医科大学更新预警期刊黑名单，著名水刊Cancers、Frontiers在列!

国自然2024年评审结果揭晓，科研征途再启航

【限时特惠】VIP社群正式上线，最新代码与数据资源百元限时抢购！

跟着高分SCI学画图：R语言2D散点核密度图

Python自动探索性数据分析库入门第1期：捕蛇者说：Python——Anaconda工具集介绍+jupyter项目简介

Python自动探索性数据分析库入门第2期：Jupyter notebook演示：使用ROC曲线对比模型表现

跟着GPT学做图：Python 抖动散点图

跟着高分SCI学画图：GPT教你绘制地理位置数据

跟着高分SCI学画图：GPT教你绘制旭日图

听劝！用ChatGPT写论文，搞科研，课题设计，1天抵博士辛苦研究1个月（赠GPT-4o账号）

跟着GPT学作图：导师教你用甘特图来写项目计划书

跟着高分SCI学画图：GPT教你绘制相关性热图

跟着高分SCI学画图：GPT教你绘制环状堆积柱状图和树状堆积柱状图

跟着高分SCI学画图：GPT教你绘制堆积柱状图

跟着高分SCI学画图：GPT教你绘制哑铃图

跟着高分SCI学画图：GPT教你绘制维恩图

跟着高分SCI学做图：三维PCA和PCoA分析的具体实现方法（内含R操作步骤及代码）

跟着Nature学画棒棒糖图：审稿人说好甜！

没数据、没基础、不花钱，通过NHANES数据库轻松发表IF 5+一区文章！

让数据更有魅力！高分SCI必备：个性化三元相图大揭秘！

资源系列|《深度学习在医学图像中的应用》

跟着GPT学习画雷达图：一张图看懂多款车型的性能优劣！

上海交通大学：关于使用深度学习模型配合大语言模型对糖尿病的诊断和治疗进行辅助的验证

深度学习图像建模，LANCET子刊唾手可得！

跟着Nature子刊学习半小提琴半箱线图的绘制

让数据更有魅力！高分SCI必备：个性化山脊图与双向柱状图大揭秘！

资源系列|《机器学习及R应用》

Python绘图系列|（1）如何用Python绘制双向渐变柱状图

R语言小白绘图系列·第34弹|连续变量生存曲线

R语言小白绘图系列·第33弹|离散变量生存曲线

资源系列|《R语言预测实战》预测分析改变世界，你准备好了吗？

好书推荐|《基础统计学(第14版)》数据改变世界，你准备好了吗？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉