生存分析(survival analysis)
1.是将事件的结果(终点事件)和出现这一结果所经历的时间结合起来分析的一种统计分析方法。
2.生存分析不同于其它多因素分析的主要区别点就是生存分析考虑了每个观测出现某一结局的时间长短。
生存分析基本概念
生存资料的基本特点
生存资料通常具有以下几个特点:
①蕴涵有结局和时间两个方面的信息;
②结局为两分类互斥事件;
③一般是通过随访收集得到,随访观察往往是从某统一时间点(如确诊、入院或实施手术等某种处理措施后)开始,观察到某规定时间点截止;
④常因失访等原因造成某些研究对象的生存时间数据不完整。
1.生存时间(survival time,failure time )
终点事件(失效时间)与起始事件之间的时间间隔。
终点事件指研究者所关心的特定结局。
起始事件是反映研究对象生存过程的起始特征的事件。
生存时间举例
起始事件终点事件
服药 痊愈
手术切除 死亡
染毒 死亡
化疗 缓解
缓解 复发
终点事件和起始事件是相对而言的,它们都由研究目的决定,须在设计时明确规定,并在研究期间严格遵守,不能随意改变。
生存时间的类型
(1)完全数据(complete data)
从起点至死亡(死于所研究疾病)所经历的时间。
(2)截尾数据(删失数据,censored data)
从起点至截尾点所经历的时间。
截尾原因:失访、死于其它疾病、观察结束时病人尚存活等。
生存时间
生存时间的度量单位可以是年、月、日、小时等。常用符号t表示,截尾数据在其右上角标记“+”。
生存资料的主要特点:
·含有截尾数据。
·截尾数据的特点:真实的生存时间未知,只知道比观察到的截尾生存时间要长。
·生存时间的分布一般不呈正态分布。
生存时间三要素:起始时间、终点事件和时间度量。
2.条件生存概率、生存率、生存曲线
条件生存概率:
(conditional probability of survival)
表示某单位时段开始时存活的个体,到该时段结束时仍存活的可能性。
年条件生存概率表示年初尚存人口存活满1年的可能性。
生存率:
(survival rate, survival function )
指观察对象经历t个单位时段后仍存活的可能性。
生存率的标准误:记为,表示生存率的抽样误差。计算式为
生存率与条件生存概率不同。条件生存概率是单个时段的结果,而生存率实质上是累积条件生存概率(cumulative probability of survival),是多个时段的累积结果。例如,3年生存率是第1年存活,第2年也存活,第3年还存活的可能性。
3.死亡概率:指在某单位时段开始时存活的个体在该时段内死亡的可能性大小,记为q。年死亡概率的计算公式为
若年内有截尾,则分母用校正人口数,计算公式为