Questions tagged «survival»

生存分析对事件数据的时间进行建模,通常是死亡时间或故障时间。审查数据是生存分析的常见问题。

2
生存分析,其中协变量不可用于检查数据
我正在看法官作出决定所需的时间。每个法官都会评估许多申请人,可以批准或不批准该申请。法官在听证会后的某个时间提交报告,案子才定案。在研究期结束时,仍有许多案件尚未解决。 我想估计案例在系统中移动所需的平均时间。此外,我想看看被拒绝的案件是否比被批准的案件花费的时间更长。(法官们似乎花费更多的时间来编写他们最终未能批准的报告,或者寻求额外的文档)。 显然,我不知道研究结束时仍在审理中的案件是否会得到批准,因此协变量(批准/不批准)与数据一起被检查。 有什么我可以做的吗?
9 survival 

1
具有时间相关变量的周期性事件数据的数据结构和函数调用
我试图估算的2种药物(的影响drug1,drug2在(病人的跌倒的可能性)event)。患者可以跌倒不止一次,并且可以在任何时候穿上或脱下药物。 我的问题是,关于时间段(天)的数据应如何组织,特别是两天之间是否需要重叠。我认为我的结构有错误的原因有两个,第一个是看似不正确的N。在时间段为一天(即)的情况下,我也遇到了一些错误time1=4,time2=4并且不确定如何编码。后续输入的开始时间应该是先前输入的停止时间吗?我已经尝试了两种方式(有和没有重叠),并且尽管重叠消除了警告,但N仍然不正确。 Warning message: In Surv(time = c(0, 2, 7, 15, 20, 0, 18, 27, 32, 35, 39, 46, 53, : Stop time must be > start time, NA created 现在,我已经设置了数据,下一个条目的开始是第二天。独特的患者由其识别chart numbers。 Time1 Time2 Drug1 Drug2 Event ChartNo 0 2 1 0 0 123 3 10 1 1 1 123 …
9 r  survival  cox-model 

1
生存分析以进行事件预测
对于数据集中的每条记录,我都有以下信息 (X1 ,… ,Xm ,δ ,T )(X1 ,… ,Xm ,δ ,T ) (X_1 \ , \dots \ , X_m \ , \delta \ , T \ ) 其中是要素,如果目标事件发生,为1,否则为0,为发生事件的时间戳。特别是,如果没有事件或未设定后续行动的时间,则可能会丢失。XiXiX_iδδ\deltaTTTTTT 我想为数据集中的每条记录计算一个风险指数。 我当时正在考虑使用功能来预测类的分类模型。但是,很重要:如果事件可能很快发生,则风险应该更高。XiXiX_iδδ\deltaTTTδδ\delta 这就是为什么生存分析应该适合这个问题的原因。我不需要的完整估计,而只需要一个代表单个记录风险的单个索引。S(t)=P(T>t)S(t)=P(T>t)S(t) = P(T>t) 可以为每条记录计算的平均生存时间似乎是一个不错的风险指数-风险越低越低。 我的问题是: 生存分析是否适合我的目的? 如何评估模型的性能? 关于问题(2):例如,我很想使用Harrell的 -index,但是我不确定要使用哪个预测结果来进行计算。从Harrell的书《回归建模策略》第247页:ccc 该指数[...]被拍摄到所有可能对这样一个主题作出回应,其他的都没有计算。该指数是这样的对的比例,其中响应者具有比非响应者更高的预测响应概率。ccc 如果发现生存分析是正确的选择,我认为使用某种标准方法引入时变协变量应该很容易。Xi(t)Xi(t)X_i(t)

2
R中的间隔审查Cox比例风险模型
给定间隔审查的生存时间,我如何在中执行间隔审查的Cox PH模型R?随便搜索即可找到该软件包intcox,该软件包不再存在于R存储库中。我几乎肯定该包中的coxph功能survival无法处理间隔检查的生存数据。 另外,我不想插入数据然后使用该coxph函数。该方法低估了系数的标准误差,因为您忽略了间隔检查的不确定性。

2
如何对R中的生存数据执行Wilcoxon符号秩检验?
假设您有以下生存数据: obs <- data.frame( time = c(floor(runif(100) * 30), floor((runif(100)^2) * 30)), status = c(rbinom(100, 1, 0.2), rbinom(100, 1, 0.7)), group = gl(2,100) ) 要执行标准的日志等级测试,可以使用 survdiff(Surv(time, status) ~ group, data = obs, rho = 0) 对? 但是其他测试呢?您如何执行Wilcoxon签名秩检验,Peto检验或Fleming-Harrington检验? R提供了执行Wilcoxon测试的可能性,但是我没有找到如何让它考虑审查的方法。 此外,文档指出,设置rho = 1将使测试成为“ Gehan-Wilcoxon测试的Peto和Peto修改”。但这是否与Peto测试相同?

1
生存Coxph和RMS CPH的不同预测图
我已经创建了本示例中使用的术语图的略微增强版本,您可以在此处找到它。我以前在SO上发布过文章,但我想得更多,我认为这可能与Cox比例危害模型的解释有关,而不是与实际编码有关。 问题 当我查看危害比图时,我希望有一个参考点,其置信区间自然为0,这是当我从中使用cph()rms package而不是从中使用coxph()时的情况survival package。coxph()的行为是否正确,如果是,参考点是什么?另外,coxph()中的哑变量具有一个间隔,并且其值不是?Ë0Ë0e^0 例 这是我的测试代码: # Load libs library(survival) library(rms) # Regular survival survobj <- with(lung, Surv(time,status)) # Prepare the variables lung$sex <- factor(lung$sex, levels=1:2, labels=c("Male", "Female")) labels(lung$sex) <- "Sex" labels(lung$age) <- "Age" # The rms survival ddist <- datadist(lung) options(datadist="ddist") rms_surv_fit <- cph(survobj~rcs(age, 4)+sex, data=lung, x=T, y=T) …
9 r  survival  cox-model 

3
如何验证极低的错误率
我面临尝试通过测试证明传感器的错误率极低(在1,000,000次尝试中不超过1个错误)的问题。我们进行实验的时间有限,因此我们预计无法获得超过4,000次尝试。我看不出传感器不符合要求的问题,因为即使在4,000次尝试中发生一个错误,对于错误率的下限仍大于0.000001的情况,也会产生95%的置信区间。然而,表明它确实满足要求是问题,因为即使4,000次尝试中的0个错误仍然会导致下限大于0.000001。任何建议将不胜感激。

2
计算数据的ROC曲线
因此,我进行了16次试验,试图使用汉明距离从生物特征中鉴定一个人。我的阈值设置为3.5。我的数据如下,只有试验1为“真阳性”: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 我的困惑是,我真的不确定如何根据此数据制作ROC曲线(FPR与TPR或FAR与FRR)。哪一个都不重要,但是我只是对如何进行计算感到困惑。任何帮助,将不胜感激。
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

4
考克斯回归和时间尺度
Cox比例风险回归分析中的X(风险)变量是否始终必须是时间?如果没有,请提供一个例子吗? 癌症患者的年龄可以成为危险因素吗?如果是这样,是否可以将其解释为一定年龄的患癌风险?Cox回归是否是研究基因表达与年龄之间关联的合法分析?

2
如何确定缺少数据的生存模型是否合适?
稍微简化一点,我有大约一百万条记录,记录了系统中大约十年的人员进入和退出时间。每个记录都有一个进入时间,但不是每个记录都有一个退出时间。系统中的平均时间约为1年。 缺少退出时间的原因有两个: 捕获数据时,该人尚未离开系统。 没有记录该人的离开时间。碰巧是记录的50% 感兴趣的问题是: 人们在系统上花费的时间更少了吗? 是否记录了更多的退出时间,以及有多少。 我们可以通过说出口被记录的概率随时间线性变化,并且系统中的时间具有一个威布尔(Weibull),其参数随时间线性变化来对此建模。然后,我们可以对各种参数进行最大似然估计,并仔细研究结果并认为它们是合理的。我们选择了Weibull分布,因为它似乎用于测量寿命,并且说起来有趣,而不是比说gamma分布更好地拟合数据。 我应该在哪里寻找有关如何正确执行此操作的线索?我们在数学上有些精明,但在统计学上却不是很精明。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.