Questions tagged «odds-ratio»

两个二进制变量之间的关联度,等于一个变量中“正”结果的几率除以另一个变量的几率。OR范围(0,无穷大)。它与逻辑回归有很强的联系。

2
泊松回归估计二元结果的相对风险
简要总结 为什么在具有二元结果的队列研究中使用逻辑回归(具有比值比),而不是与泊松回归(具有相对风险)相比,更普遍? 背景 根据我的经验,本科生和研究生的统计和流行病学课程通常会讲逻辑回归应用于对具有二元结果的数据进行建模,风险估计值以比值比报告。 但是,泊松回归(以及相关的:拟泊松,负二项式等)也可以用于对具有二元结果的数据进行建模,并通过适当的方法(例如鲁棒的三明治方差估计器)提供有效的风险估计和置信度。例如, Greenland S.,基于模型的相对风险和其他流行病学方法在共同结局研究和病例对照研究中的估计,Am J Epidemiol。2004年8月15日; 160(4):301-5。 Zou G.,使用二进制数据进行前瞻性研究的改进的Poisson回归方法,《美国流行病学杂志》。2004 Apr 1; 159(7):702-6。 Zou GY和Donner A.,将修正的Poisson回归模型扩展到具有相关二元数据的前瞻性研究,Stat Methods Med Res。2011年11月8日。 通过泊松回归,可以报告相对风险,其中一些人认为相对风险比与比值比更容易解释,尤其是对于频繁的结局,尤其是对于没有统计学背景的个人而言。请参见张J.和于克芬,相对风险是多少?一种校正常见结局队列研究中的优势比的方法,JAMA。1998年11月18日; 280(19):1690-1。 通过阅读医学文献,在具有二元结果的队列研究中,似乎似乎更普遍的是通过逻辑回归报告比值比,而不是通过泊松回归报告相对风险。 问题 对于具有二元结果的队列研究: 是否有充分的理由报告逻辑回归的优势比,而不是泊松回归的相对风险? 如果不是,医学文献中具有相对风险的Poisson回归频率不高是否可以归因于科学家,临床医生,统计学家和流行病学家在方法论理论与实践之间的滞后? 中间统计学和流行病学课程是否应包括更多关于二元结果的泊松回归的讨论? 我是否应该鼓励学生和同事在适当的时候考虑使用泊松回归而不是逻辑回归?

4
R的Logistic回归(几率)
我正尝试在中进行逻辑回归分析R。我已经使用STATA参加了涵盖此材料的课程。我发现很难复制中的功能R。这个地区成熟吗?似乎几乎没有可用的文档或指南。生产比值比输出似乎需要安装epicalc和/或epitools和/或其他工具,我无法上班,都已过时或缺少文档。我曾经glm做过逻辑回归。欢迎大家提出意见。 我最好把这个问题变成一个真实的问题。如何进行逻辑回归并产生比值比R? 这是我为单变量分析所做的工作: x = glm(Outcome ~ Age, family=binomial(link="logit")) 对于多变量: y = glm(Outcome ~ Age + B + C, family=binomial(link="logit")) 然后,我已经看了x,y,summary(x)和summary(y)。 是x$coefficients任何价值?
40 r  logistic  odds-ratio 

1
为什么我的p值在逻辑回归输出,卡方检验和OR的置信区间之间有所不同?
我建立了Logistic回归,其中在接受治疗后(Curevs. No Cure)治愈了结果变量。本研究中所有患者均接受治疗。我有兴趣查看是否患有糖尿病与该结局有关。 在R中,我的逻辑回归输出如下所示: Call: glm(formula = Cure ~ Diabetes, family = binomial(link = "logit"), data = All_patients) ... Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 1.2735 0.1306 9.749 <2e-16 *** Diabetes -0.5597 0.2813 -1.990 0.0466 * ... Null deviance: 456.55 on 415 degrees of freedom Residual deviance: 452.75 …

3
逻辑回归中简单预测对优势比的解释
我对使用逻辑回归有些陌生,并且对以下值的解释之间的差异有些困惑,我认为这是相同的: 指数贝塔值 使用beta值预测结果的可能性。 这是我使用的模型的简化版本,营养不足和保险都是二进制的,财富是连续的: Under.Nutrition ~ insurance + wealth 我的(实际)模型返回的保险指数值为0.8,我将其解释为: “被保险人营养不足的概率是未保险人营养不足的概率的0.8倍。” 但是,当我通过将0和1的值分别输入保险变量和财富平均值来计算个人的概率差异时,营养不足的差异仅为0.04。计算公式如下: Probability Undernourished = exp(β0 + β1*Insurance + β2*Wealth) / (1+exp(β0 + β1*Insurance + β2*wealth)) 如果有人可以解释为什么这些值不同,以及什么是更好的解释(尤其是第二个值),我将不胜感激。 进一步的澄清编辑 据我了解,未投保的人(其中B1对应于保险)营养不足的可能性为: Prob(Unins) = exp(β0 + β1*0 + β2*Wealth) / (1+exp(β0 + β1*0+ β2*wealth)) 虽然被保险人营养不足的可能性是: Prob(Ins)= exp(β0 + β1*1 + β2*Wealth) / (1+exp(β0 …

1
帮助我了解逻辑回归中的调整后的优势比
我一直很难理解一篇论文中逻辑回归的用法。此处可用的论文使用逻辑回归来预测白内障手术期间发生并发症的可能性。 令我感到困惑的是,该论文提出了一个将比值比1分配给基线的模型,描述如下: 对于所有风险指标而言,其风险状况均属于参考组的患者(即,表1中所有风险指标均已调整为OR = 1.00)可被视为具有“基准风险状况”,而逻辑回归模型表明其具有“基准预测概率” PCR或VL或两者均= 0.736%。 因此,以0.00的比值比表示0.00736的概率。基于从概率到比值比的转换:,它不能等于1: 。o=p1−po=p1−po=\frac{p}{1-p}0.00741=0.007361−0.007360.00741=0.007361−0.007360.00741=\frac{0.00736}{1-0.00736} 它变得更加混乱。代表多个协变量的复合比值比具有不同于基线的值,用于计算预测风险。 ...表1的复合OR为1.28 X 1.58 X 2.99 X 2.46 X 1.45 X 1.60 = 34.5,从图1的图中可以看出,该OR与预测的PCR或VL或两者的预测概率相对应大约20% 得出示例中给出的值的唯一方法是将基线概率乘以这样的复合赔率: 。0.2025=(34.50 × 0.00736)1 + (34.50 × 0.00736)0.2025=(34.50 × 0.00736)1 + (34.50 × 0.00736)0.2025=\frac{(34.50\ \times\ 0.00736)}{1\ +\ (34.50\ \times\ 0.00736)} 那么这是怎么回事?将比值比1分配给非0.5的基线概率有什么逻辑?我上面提出的更新公式提供了本文中示例的正确概率,但这并不是我期望的比值比的直接乘积。之后怎么样了?


1
有序逻辑回归中的负系数
假设我们有序数响应和我们认为的一组变量将解释。然后,我们对(响应)进行(设计矩阵)的有序逻辑回归。y:{Bad, Neutral, Good}→{1,2,3}y:{Bad, Neutral, Good}→{1,2,3}y:\{\text{Bad, Neutral, Good}\} \rightarrow \{1,2,3\}X:=[x1,x2,x3]X:=[x1,x2,x3]X:=[x_1,x_2,x_3]yyyXXXyyy 假设的估计系数称为,在有序logistic回归中为。如何解释的优势比(OR)?β 1 - 0.5 Ë - 0.5 = 0.607x1x1x_1β^1β^1\hat{\beta}_1−0.5−0.5-0.5e−0.5=0.607e−0.5=0.607e^{-0.5} = 0.607 我说“在一个增加1个单位,其他条件不变,观察的几率是观察的时间赔率,并在相同的变化,观察的几率是观察的时间赔率 “?x1x1x_1GoodGood\text{Good}0.6070.6070.607Bad∪NeutralBad∪Neutral\text{Bad}\cup \text{Neutral}x1x1x_1Neutral∪GoodNeutral∪Good\text{Neutral} \cup \text{Good}0.6070.6070.607BadBad\text{Bad} 在我的教科书或Google中找不到负系数解释的任何示例。

4
梯度提升机的精度随着迭代次数的增加而降低
我正在通过caretR中的程序包尝试使用梯度增强机算法。 使用一个小的大学录取数据集,我运行了以下代码: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage = …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 



1
优势比的荟萃分析是否基本没有希望?
在最近的一篇论文中,诺顿等人。(2018)指出[1][1]^{[1]} 当导致赔率估算的统计模型具有不同的解释变量时,无法比较来自同一研究的不同赔率,因为每个模型具有不同的任意比例因子。也不能将一项研究的优势比的幅度与另一项研究的优势比的幅度进行比较,因为不同的样本和不同的模型规格将具有不同的任意缩放因子。进一步的暗示是,在多项研究中,给定关联的比值比的大小无法在荟萃分析中进行综合。 一个小的模拟说明了这一点(R代码在问题的底部)。假设真实模型为: 进一步想象一下,由四个不同的研究人员使用逻辑回归分析了上述模型生成的相同数据。研究人员1仅包含作为协变量,研究人员2同时包含和,依此类推。四位研究人员的优势比的平均模拟估计值为:logit(yi)=1+log(2)x1i+log(2.5)x2i+log(3)x3i+0x4ilogit(yi)=1+log⁡(2)x1i+log⁡(2.5)x2i+log⁡(3)x3i+0x4i \mathrm{logit}(y_{i})=1 + \log(2)x_{1i} + \log(2.5)x_{2i} + \log(3)x_{3i} + 0x_{4i} x1x1x_{1}x1x1x_{1}x2x2x_{2}x1x1x_{1} res_1 res_2 res_3 res_4 1.679768 1.776200 2.002157 2.004077 显然,只有研究人员3和4获得了大约的正确比值比,而研究人员1和2没有。这在线性回归中不会发生,可以通过类似的模拟轻松显示(此处未显示)。我必须承认,尽管这个问题似乎是众所周知的,但这个结果对我来说却是令人惊讶的。Hernán等。(2011)将此称为“数学上的奇异性”,而不是偏见。222[2][2]^{[2]}[3][3]^{[3]} 我的问题: 如果各研究和模型之间的优势比基本上不可比,那么我们如何结合不同研究的结果以得出二元结果呢? 有什么可以对无数的元分析的结果可以说并从不同的研究结合起来,优势比,每个研究可能调整不同协变量集?他们本质上是无用的吗? 参考文献 [1]:Norton EC,Dowd BE,Maciejewski ML(2018年):赔率-当前最佳实践和使用。JAMA 320(1):84-85。 [2]:Norton EC,Dowd BE(2017年):对数赔率和Logit模型的解释。卫生服务水库。53(2):859-878。 [3]:HernánMA,Clayton D,Keiding N(2011):揭开了辛普森悖论的面纱。Int J Epidemiol 40:780-785。 揭露 问题(包括R代码)是用户timdisher在数据方法上提出的问题的修改版本。 R代码 set.seed(142857) n_sims <- 1000 # number …

3
通过逻辑回归生成比值比置信区间的不同方法
我正在研究如何根据逻辑回归中获得的系数为比值比构建95%的置信区间。因此,考虑逻辑回归模型, log(p1−p)=α+βxlog⁡(p1−p)=α+βx \log\left(\frac{p}{1 - p}\right) = \alpha + \beta x \newcommand{\var}{\rm Var} \newcommand{\se}{\rm SE} 这样,对于对照组,x=0x=0x = 0,对于病例组,x=1x=1x = 1。 我已经读过,最简单的方法是为\ beta构造95%CI,ββ\beta然后我们应用指数函数,即 β^±1.96×SE(β^)→exp{β^±1.96×SE(β^)}β^±1.96×SE(β^)→exp⁡{β^±1.96×SE(β^)} \hat{\beta} \pm 1.96\times \se(\hat{\beta}) \rightarrow \exp\{\hat{\beta} \pm 1.96\times \se(\hat{\beta})\} 我的问题是: 证明该程序合理的理论原因是什么?我知道odds ratio=exp{β}odds ratio=exp⁡{β}\mbox{odds ratio} = \exp\{\beta\}并且最大似然估计是不变的。但是,我不知道这些元素之间的联系。 增量法是否应该产生与先前步骤相同的95%置信区间?使用增量法 exp{β^}∼˙N(β, exp{β}2Var(β^))exp⁡{β^}∼˙N(β, exp⁡{β}2Var(β^))\exp\{\hat{\beta}\} \dot{\sim} N(\beta,\ \exp\{\beta\}^2 \var(\hat{\beta})) 然后, exp{β^}±1.96×exp{β}2Var(β^)−−−−−−−−−−−−√exp⁡{β^}±1.96×exp⁡{β}2Var(β^)\exp\{\hat{\beta}\} \pm 1.96\times …

2
指数对数回归系数与比值比不同
据我了解,对数回归的指数贝塔值是该变量与相关因变量的比值比。但是,该值与手动计算的优势比不匹配。我的模型使用保险等其他指标预测发育迟缓(营养不良的一种衡量标准)。 // Odds ratio from LR, being done in stata logit stunting insurance age ... etc. or_insurance = exp(beta_value_insurance) // Odds ratio, manually calculated odds_stunted_insured = num_stunted_ins/num_not_stunted_ins odds_stunted_unins = num_stunted_unins/num_not_stunted_unins odds_ratio = odds_stunted_ins/odds_stunted_unins 这些值不同的概念原因是什么?控制回归中的其他因素?只是想能够解释差异。

2
优势比和危险比之间是否存在功能差异?
在逻辑回归中,优势比为2意味着在预测变量增加1个单位的情况下,该事件的可能性高2倍。在Cox回归中,危险比为2意味着,如果预测变量增加一个单位,则该事件在每个时间点的发生频率将是两倍。这些实际上不是一回事吗? 如果我们可以从逻辑回归的优势比中获得功能上相同的信息,那么进行Cox回归和获得风险比的优势是什么?

2
引用统计检验两个比值比之间的差异?
@gung 在这里发表评论,写道: 我相信它们可以重叠一点(也许〜25%),并且在5%的水平上仍然很重要。请记住,您看到的95%CI是针对单个OR,但是对2个OR的测试是关于它们之间的差异。但是,如果它们根本不重叠,那么它们肯定会明显不同;如果95%CI与其他OR点估计值重叠,则它们肯定不会重叠。 有没有人引用上述声明?审稿人要我计算两个比值比是否显着不同。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.