[转]生存分析之Kaplan-Meier曲线

[转]生存分析之Kaplan-Meier曲线转载自画说统计|生存分析之Kaplan-Meier曲线都告诉我们什么临床研究中,存在这样一类研究,我们关注的临床结局是一个事件,比如:死亡,复发,症状消失,疾病痊愈等等。在很多情况下,我们不仅关注事件是否发生,还会关注事件发生的早晚。同时,由于研究周期的限定,和患者依从性的差异,是我们不可能追踪到所有结局事件的发生。面对这样的数据该如何统计分析呢?办法当然有,由于最初这类方法被应用于针对死亡结局的分析中,所以这类分析被称为:生存分析。其中,Kaplan-Meier方法是帮助我们描述生存结局(或者说,

大家好,欢迎来到IT知识分享网。

转载自画说统计 | 生存分析之Kaplan-Meier曲线都告诉我们什么

临床研究中,存在这样一类研究,我们关注的临床结局是一个事件,比如:死亡,复发,症状消失,疾病痊愈等等。在很多情况下,我们不仅关注事件是否发生,还会关注事件发生的早晚。同时,由于研究周期的限定,和患者依从性的差异,是我们不可能追踪到所有结局事件的发生。

面对这样的数据该如何统计分析呢?办法当然有,由于最初这类方法被应用于针对死亡结局的分析中,所以这类分析被称为:生存分析。其中,Kaplan-Meier方法是帮助我们描述生存结局(或者说,终点事件)发生情况的有效手段。
为了方便理解,我们首先回顾一下这类研究的过程。已疾病死亡为例。
我们用横轴表达研究的时间轴,随着研究的开始,患者开始纳入研究:
在这里插入图片描述
随着时间的推移,越来越多的患者加入到研究中:在这里插入图片描述
继续我们的观察,开始有患者出现了我们所期待的终点事件,像这样获得了终点事件的观察数据我们称其为完全数据:在这里插入图片描述
当然,也有患者在没有出现所期待的终点事件的情况下离开研究(比如失访的患者)。此类未能获得终点事件发生情况的数据我们称之为删失数据:在这里插入图片描述
随着时间推移,越来越多的患者出现了所期待的终点事件,当然也有不少人悄悄离开:在这里插入图片描述
当然,到了研究结束的时刻,也一定还有对我们不离不弃但一直没有出现预期终点事件的患者不得不离开研究:在这里插入图片描述
面对这样的数据我们应该如何描述他的生存特征呢?很显然,如果我们仅仅把患者按照是否观察到预期的终点事件分为两类显然是不公平的:在这里插入图片描述
因为删失病例完全有可能因为观察时间的不足而导致未来得及发生期待的终点事件。从终点事件的观察角度看,删失数据的信息是不完整的,我们并不知道这样的病例会在什么时刻发生我们期望看到的终点事件而仅仅知道在他的随访时间内,这个病例没有出现期待的终点事件。

在这种情况下,采用生存分析方法才是合理的选择。 其中,Kaplan-Meier方法是帮助我们描述终点事件发生率的有效手段。
要怎么做呢?
首先,我们需要把所有研究对象按照随访时间的长度整齐排列(当然不用手工完成,有软件在,我们明白道理就好):在这里插入图片描述
然后绘制曲线。
怎么画出来的,一会儿再说。我们先看看曲线都告诉我们什么:他的横轴是时间,纵轴是生存率:在这里插入图片描述
也就是说Kaplan-Meier曲线为我们描画了患者生存率随时间变化的特征。他完美的将时间因素考虑在内,各个时间点的生存率值也被称为时点生存率。
线上有许多绿色的十字(有些图线会略去他们,也是可以的),他们对应的是删失数据们的随访时间长度:在这里插入图片描述
生存曲线呈现折线的样子,每一个“台阶”都对应着一个发生终点事件的时间点:在这里插入图片描述
也就是每次有终点事件出现的时刻都会计算一次生存率,把他们用折线连接就构成了生存曲线。
关键的问题来了,这个生存率是怎么算出来的呢?
在研究的起始处,生存率当然是100%啦:在这里插入图片描述
我们接下来看第一个事件出现的时刻:在这里插入图片描述
在这个事件发生时,共有12例患者处于观察中,其中一人出现终点事件,死亡1/12=0.0833;生存11/12=0.9167,于是生存率就这样计算出来啦:91.67%。
后面的点又该怎样呢?我们来看第二个点吧:在这里插入图片描述
在这个时段,共有11人坚持随访,其中一人发生终点事件,10人生存。故而生存概率为10/11=0.9091。由于这个时刻的生存情况实在上一个时间点的基础上产生的,所以这个时点的累积生存率也要基于上一个时间点生存率计算,那就是:

0.9167X0.9091=83.33%
第三个结局事件发生之前,已经有一例删失病例出现,所以到这时,仅余9人在随访过程中,其中一人发生终点事件,生存8/9=0.8889。同样的,基于前一时刻的生存率计算本时刻的累计生存率,就是:

0.8333X0.8889=74.07%

由此可见,Kaplan-Meier方法在计算生存率的过程中充分利用了删失数据所提供的不完全信息。虽然我们不能知道这个病例会在什么时候发生终点事件,但是我们至少知道了在随访时间段内这个病例是没有发生终点事件的。所以在计算累计生存率的时候,在他的随访时间内他被作为未发生结局的病例参与计算。删失后则从观察病例中移除。
如上往复,我们可以获得完整的生存曲线:在这里插入图片描述
可见各时点的累计生存率,是由此前所有时点的生存概率连乘获得的。所以这个推演生存率的方法还有一个很雅致的名字:乘积极限法。
综上,生存曲线为我们描绘了结局事件的显现过程,我们可以把它表达为随着终点事件的出现 ,生存率的下降:在这里插入图片描述
或者改变纵坐标,表达为随着时间推移,终点事件发生率逐渐增高的方式:在这里插入图片描述
当然,也有机会对两条或多条生存曲线给予直观的描绘,还可以进一步通过假设检验表明其差异:
在这里插入图片描述

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/24176.html

(0)

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

关注微信