Questions tagged «cox-model»

Cox比例风险回归是用于生存分析的半参数方法。无需假设分布形式,仅协变量中单位增加的影响是一个常数倍。

5
Cox回归的预测
我正在执行多变量Cox回归,我有重要的自变量和beta值。该模型非常适合我的数据。 现在,我想使用我的模型并预测新观测值的生存时间。我不清楚如何使用Cox模型执行此操作。在线性或逻辑回归中,这很容易,只需将新观测值放入回归中并将它们乘以beta,就可以预测结果了。 如何确定基线危害?除了计算预测之外,我还需要它。 在Cox模型中如何完成?


2
在生存分析中,为什么我们使用半参数模型(Cox比例风险)而不是完全参数模型?
该问题是从Mathematics Stack Exchange 迁移而来的,因为可以通过交叉验证来回答。 迁移 6年前。 我一直在研究Cox比例危害模型,大多数文本都掩盖了这个问题。 考克斯建议使用部分似然法拟合危险函数的系数,但为什么不仅仅使用最大似然法和线性模型拟合参量生存函数的系数呢? 在任何情况下,只要您检查了数据,就可以找到曲线下的面积。例如,如果您的估计值为380,标准差为80,并且样本的检查数量大于300,则在假设法向误差的情况下,可能性计算中该样本的概率为84%。

1
考克斯基线危险
假设我有一个“肾脏导管”数据集。我正在尝试使用Cox模型为生存曲线建模。如果我考虑一个Cox模型:需要估计基准危害。通过使用内置的包R函数,我可以轻松地做到这一点:ħ (吨,ž)= 小时0经验值(b′ž),h(t,Z)=h0exp⁡(b′Z),h(t,Z) = h_0 \exp(b'Z),survivalbasehaz() library(survival) data(kidney) fit <- coxph(Surv(time, status) ~ age , kidney) basehaz(fit) 但是,如果我想针对给定的参数估计值编写基准危害的逐步函数,该b如何进行?我试过了: bhaz <- function(beta, time, status, x) { data <- data.frame(time,status,x) data <- data[order(data$time), ] dt <- data$time k <- length(dt) risk <- exp(data.matrix(data[,-c(1:2)]) %*% beta) h <- rep(0,k) for(i in 1:k) { …
19 r  cox-model  hazard 

2
的coxph模型摘要中给出的“
中的Coxph模型摘要中给出的值是多少?例如,[R2[R2R^2 Rsquare= 0.186 (max possible= 0.991 ) 我愚蠢地将其包括为值的手稿,审稿人跳了起来,说他不知道 正在为Cox模型开发的经典线性回归中的统计量的类似物,如果有请提供参考。任何帮助将是巨大的![R2[R2R^2[R2[R2R^2

1
为什么Cox比例风险模型中的p值通常比逻辑回归中的p值高?
我一直在学习Cox比例风险模型。我有很多适合逻辑回归模型的经验,因此,为了建立直觉,我一直在比较coxphR“ survival”中使用的模型glm与配合使用的逻辑回归模型family="binomial"。 如果我运行代码: library(survival) s = Surv(time=lung$time, event=lung$status - 1) summary(coxph(s ~ age, data=lung)) summary(glm(status-1 ~ age, data=lung, family="binomial")) 我分别获得了0.0419和0.0254年龄的p值。同样,如果我使用性别作为预测因子,则可以选择是否带有年龄。 我感到困惑,是因为我认为,拟合模型时考虑到流逝的时间比将死亡视为二进制结果会带来更多的统计能力,而p值似乎与统计能力较小的人一致。这里发生了什么?

3
R中随时间变化的系数-怎么做?
更新:很抱歉要进行其他更新,但是我发现了一些需要解决的小数多项式和竞争性风险组合的解决方案。 问题 我在R中找不到一种简单的方法来进行时变系数分析。我希望能够将变量系数转换为时变系数(而不是变量),然后绘制随时间变化的图: β米ÿ_ v a r a a b l e= β0+ β1个* t + β2* Ť2。。。β米ÿ_v一种[R一世一种b升Ë=β0+β1个∗Ť+β2∗Ť2。。。\beta_{my\_variable}=\beta_0+\beta_1*t+\beta_2*t^2... 可能的解决方案 1)分割数据集 我看了这个示例(实验课程的第2部分),但是创建一个单独的数据集似乎很复杂,计算量大,而且不是很直观... 2)降级模型-coxvc软件包 该coxvc包提供了处理问题的一种优雅的方式-这里有一个手动。问题在于作者不再开发该软件包(最新版本是自2007年5月23日以来),经过一些电子邮件对话,我已经使该软件包起作用,但是我的数据集运行了5个小时(140 000项),并在此期间结束时给出极端估算。您可以在这里找到稍微更新的软件包 -我基本上只是更新了plot函数。 这可能只是一个调整问题,但是由于该软件无法轻松提供置信区间,并且该过程非常耗时,因此我现在正在寻找其他解决方案。 3)timereg包 令人印象深刻的timereg软件包也解决了这个问题,但是我不确定如何使用它,也无法给我一个顺利的过程。 4)分数多项式时间(FPT)模型 我发现Anika Buchholz在“评估随时间变化的疗法和预后因素的长期效果 ”方面的出色论文,在涵盖不同模型方面做得很好。她的结论是,Sauerbrei等人提出的FPT似乎最适合于时间相关系数: FPT非常擅长检测时变效应,而“降低秩次”方法会导致模型过于复杂,因为它不包括时变效应的选择。 研究似乎很完整,但对我来说却有点遥不可及。自从她碰巧与Sauerbrei合作以来,我还有些纳闷。听起来似乎不错,但我想可以使用mfp软件包进行分析,但是我不确定如何做。 5)cmprsk软件包 我一直在考虑进行竞争性风险分析,但是计算非常耗时,因此我改用常规的Cox回归。该CRR有thoug时间依赖性协变量的选项: .... cov2 matrix of covariates that will be multiplied by functions of time; if …

1
如何解释predict.coxph的输出?
拟合coxmodel之后,可以进行预测并检索新数据的相对风险。我不了解的是如何计算一个人的相对风险,以及相对风险是什么(即人口的平均值)?有什么建议可以帮助您理解(我在生存分析方面不是很先进,所以越简单越好)?

3
考克斯模型与逻辑回归
假设我们遇到以下问题: 预测未来3个月内最有可能停止在我们商店购物的客户。 对于每个客户,我们都知道他们开始在我们的商店购买商品的月份,此外,我们还具有每月汇总的许多行为功能。“老大”的客户已经买了五十个月了。让我们表示自客户开始通过()开始购买以来的时间。可以假设客户数量很大。如果客户停止购买三个月然后又回来,则将其视为新客户,因此一个事件(停止购买)只能发生一次。tttt∈[0,50]t∈[0,50]t \in [0, 50] 我想到了两种解决方案: Logistic回归 -对于每个客户和每个月(可能是最近三个月除外),我们可以说客户是否停止购买,因此我们可以对每个客户和每个月进行一次观察。我们可以将自开始以来的月数用作分类变量,以获取等效的基本危害函数。 扩展Cox模型 -也可以使用扩展Cox模型对该问题进行建模。看来这个问题更适合生存分析。 问题:在类似问题中进行生存分析有哪些优势?生存分析是出于某种原因而发明的,因此必须具有一定的优势。 我对生存分析的知识不是很深,我认为使用逻辑回归也可以实现Cox模型的大多数潜在优势。 可以使用ttt和分层变量的相互作用获得等效的分层Cox模型。 可以通过将种群分为几个亚群并为每个亚群估计LR来获得交互作用Cox模型。 我看到的唯一好处是Cox模型更加灵活。例如,我们可以轻松地计算出客户6个月后停止购买的可能性。

3
当Schoenfeld残差不佳时,比例风险回归模型有哪些选择?
我正在使用进行R的Cox比例风险回归coxph,其中包括许多变量。Martingale残差看起来很棒,而Schoenfeld残差对于ALMOST所有变量来说都很棒。存在三个变量的Schoenfeld残差不平坦,并且变量的性质使得它们可以随时间变化是有意义的。 这些是我不太感兴趣的变量,因此将它们分层即可。但是,它们都是连续变量,而不是类别变量。因此,我认为阶层不是可行的路线*。我试图建立的变量和时间之间的相互作用,如所描述这里,但我们得到的错误: In fitter(X, Y, strats, offset, init, control, weights = weights, : Ran out of iterations and did not converge 我正在处理将近1000个数据点,并且正在处理具有多个因素的六个变量,因此感觉就像我们正在限制如何对这些数据进行切片和切块的极限。不幸的是,我尝试过使用更少的包含变量的所有较简单的模型显然都较差(例如,Schoenfeld残差对于更多变量来说更加脆弱)。 我有什么选择?由于我不在乎这些行为不佳的特定变量,因此我只想忽略它们的输出,但是我怀疑这不是有效的解释! *一个是连续的,一个是大于100的整数,一个是6的整数。

3
如何从Cox PH模型获得生存时间的预测?
我想针对所有(几乎)全部在随访结束时(例如一年)死亡的参与者建立一个全因死亡率的预测模型(Cox PH)。 我不想预测某个时间点的绝对死亡风险,而是想预测每个人的生存时间(以月为单位)。 是否有可能在R中获得这样的预测(例如从一个coxph对象),如果可以,我该怎么做? 提前谢谢了!

3
机器学习模型(GBM,NN等)如何用于生存分析?
我知道传统的统计模型,例如Cox比例风险回归和一些Kaplan-Meier模型,可以用来预测直到下次事件发生的天数,例如失败等,例如生存分析 问题 机器学习模型(例如GBM,神经网络等)的回归版本如何用于预测事件发生之前的天数? 我相信仅将发生之前的天数用作目标变量并仅运行回归模型是行不通的?为什么不起作用?如何解决? 我们可以将生存分析问题转换为分类,然后获得生存概率吗?如果那么该如何创建二进制目标变量? 机器学习方法与Cox比例风险回归和Kaplan-Meier模型等的优缺点是什么? 想象一下样本输入数据的格式如下 注意: 传感器每隔10分钟对数据进行ping操作,但有时由于网络问题等原因可能会丢失数据,如带有NA的行所示。 var1,var2,var3是预测变量,解释变量。 failure_flag告知计算机是否发生故障。 每个机器ID每10分钟间隔有最近6个月的数据 编辑: 预期的输出预测应采用以下格式 注意:我想预测未来30天每天每台计算机发生故障的可能性。

2
赖曼在生存分析中对审查的解释
我已经阅读了什么是审查,以及如何在生存分析中考虑它,但是我想听听它的数学定义少而定义直观(图片很棒!)。谁能为我提供以下解释:1)审查和2)它如何影响像Kaplan-Meier曲线和Cox回归之类的事情?

1
用层和层-协变量相互作用拟合Cox模型与拟合两个Cox模型是否不同?
在Harrell的《回归建模策略》(第二版)中,有一节(第20.1.7节)讨论了Cox模型,其中包括我们也要估计其对生存率有主要影响的协变量(年龄在以下示例中)与我们不想估计其主要影响的协变量(在以下示例中为性别)。 具体而言:假设在总体中,(未知,真实)危险遵循模型ħ (吨)h(t)h(t) h (t )= { hF(t )经验(β1个年龄),H米(t )经验((β1个+ β2)年龄),对于女性患者男性患者h(t)={hf(t)exp⁡(β1age),for female patienshm(t)exp⁡((β1+β2)age),for male patiensh(t) = \begin{cases} h_f(t) \exp(\beta_1 \textrm{age}), & \textrm{for female patiens} \\ h_m(t) \exp((\beta_1 + \beta_2) \textrm{age}), & \textrm{for male patiens} \end{cases} 其中HFhfh_f,H米hmh_m是未知的,真实的,不应被估计的基准风险函数和β1个β1\beta_1,β2β2\beta_2是未知的,真正的参数来从数据中估算出来。 (这个例子几乎是从书中摘录的。) 现在,Harrell表示可以将以上情况重写为分层Cox模型模型1: h (t )= h性别(t )经验(β1个年龄 + β2X)h(t)=hgender(t)exp⁡(β1age+β2X)h(t) = h_{\textrm{gender}}(t) \exp(\beta_1 \textrm{age} + …

2
普通英语使用R解释和验证Cox比例风险回归模型
有人可以用简单的英语向我解释我的Cox模型吗? 我使用该函数将以下Cox回归模型拟合到我的所有数据中cph。我的数据保存在名为的对象中Data。变量w,x和y是连续的;z是两个层次的因子。时间以月为单位。我的一些患者缺少变量数据z(注意:下面我已经适当地指出了Harrell博士的建议,即我估算这些值,以避免对我的模型造成偏见,以后会这样做)。 > fit <- cph(formula = Surv(time, event) ~ w + x + y + z, data = Data, x = T, y = T, surv = T, time.inc = 12) Cox Proportional Hazards Model Frequencies of Missing Values Due to Each Variable Surv(time, event) w x y z …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.