Questions tagged «observational-study»

2
多元回归如何真正“控制”协变量?
我们都熟悉观察性研究,这些研究试图通过在多元回归模型中包含所有可能的潜在混杂因素,在非随机预测变量X和结果之间建立因果关系。该论点认为,通过“控制”所有混杂因素,我们可以分离出感兴趣的预测变量的影响。 我对这个想法越来越感到不适,主要是根据我的统计课程的各个教授的副言。它们分为几个主要类别: 1.您只能控制您认为和测量的协变量。 这是显而易见的,但是我想知道它是否真的是所有最有害和不可克服的。 2.这种做法在过去导致了丑陋的错误。 例如,Petitti&Freedman(2005)讨论了数十年经过统计学调整的观察性研究如何得出关于激素替代疗法对心脏病风险的影响的灾难性错误结论。后来的RCT发现了几乎相反的效果。 3.当您控制协变量时,预测结果与结果之间的关系可能会表现得很奇怪。 Tu Yu-Kang Tu,Gunnell和Gilthorpe(2008) 讨论了一些不同的表现形式,包括Lord悖论,Simpson悖论和抑制变量。 4.单一模型(多元回归)很难充分调整协变量并同时对预测结果关系建模。 我听说这是因为倾向得分和对混杂因素进行分层等方法具有优越性的原因,但是我不确定我是否真的理解。 5. ANCOVA模型要求相关的协变量和预测变量是独立的。 当然,我们会精确地调整混杂因素,因为它们与感兴趣的预测因素相关联,因此,看起来该模型在我们最想要的确切实例中不会成功。有观点认为,调整仅适用于随机试验中的降噪。Miller&Chapman,2001年作了很好的评论。 所以我的问题是: 这些问题和我可能不知道的其他问题有多严重? 当我看到一项研究“控制一切”时,我应该有多害怕? (我希望这个问题不会在讨论中冒出太大的麻烦,并乐意邀请任何改进它的建议。) 编辑:我找到新参考文献后添加了第5点。

2
是否使用结构方程模型分析心理学中的观察研究
我注意到这个问题在统计咨询设置中经常出现,我很想知道您的想法。 语境 我经常与进行研究的研究学生交谈,大致如下: 观察研究 样本大小可能是100、200、300等。 已经测量了多种心理量表(例如,焦虑,抑郁,性格,态度,其他临床量表,可能是智力等)。 研究人员已经阅读了相关文献,并对可能的因果关系有一些想法。通常,将变量一般概念化为前因,过程变量和结果变量。他们还经常听到结构方程建模更适合测试他们正在研究的变量集之间关系的整体模型。 题 您认为在什么条件下结构方程建模是分析此类研究的合适技术? 如果您不建议结构方程建模,您会推荐哪些替代技术? 对于考虑在这种情况下使用结构方程建模的研究人员,您将提供什么建议?

2
在没有仪器的情况下,关于观测数据的模型我们能说些什么?
过去,我曾在多个领域对发表的论文提出过一些问题,这些领域在观测数据(即非受控实验产生的数据)上使用了回归(以及相关模型,例如面板模型或GLM) ,在许多情况下-但并非总是-随时间推移观察到的数据),但没有尝试引入工具变量。 作为回应,我提出了许多批评(例如,当重要变量可能缺失时描述带有偏见的问题),但是由于此处的其他人无疑比我对这方面的知识要了解得多,我想问一下: 在这种情况下,试图得出有关关系的结论(特别是但不限于因果结论)有哪些主要问题/后果? 在没有仪器的情况下,适合此类模型的研究能做些有用的事情吗? 关于这种建模的问题有哪些好的参考文献(书或论文)(最好具有明显的非技术动机来进行后果分析,因为通常提出问询的人具有各种背景,有些人没有很多统计资料)一篇论文?用仪器讨论预防措施/问题也将很有用。 (有关工具变量的基本参考资料在此处,但是如果您要在其中添加任何内容,那也会有所帮助。) 指向发现和使用工具的良好实践示例的指针将是一个好处,但不是这个问题的中心。 [在出现此类问题时,我可能会在这里指出其他任何好的答案。我可能会添加一两个示例。]

1
倾向得分加权对平均治疗效果的置信区间?
我试图使用倾向评分权重(特别是IPTW)从观察数据中估计平均治疗效果。我想我正在正确计算ATE,但是我不知道如何在考虑逆倾向得分权重的同时计算ATE的置信区间。 这是我用来计算平均治疗效果的方程式(参考Stat Med。2010年9月10日; 29(20):2137–2148。): 其中受试者总数,治疗状态,结果状态,倾向得分。ATE=1N∑1NZiYipi−1N∑1N(1−Zi)Yi1−piATE=1N∑1NZiYipi−1N∑1N(1−Zi)Yi1−piATE=\frac1N\sum_1^N\frac{Z_iY_i}{p_i}-\frac1N\sum_1^N\frac{(1-Z_i)Y_i}{1-p_i}N=N=N=Zi=Zi=Z_i=Yi=Yi=Y_i=pi=pi=p_i= 有人知道R包会考虑权重来计算平均治疗效果的置信区间吗?可以在survey这里包帮助吗?我想知道这是否行得通: library(survey) sampsvy=svydesign(id=~1,weights=~iptw,data=df) svyby(~surgery=='lump',~treatment,design=sampsvy,svyciprop,vartype='ci',method='beta') #which produces this result: treatment surgery == "lump" ci_l ci_u No 0.1644043 0.1480568 0.1817876 Yes 0.2433215 0.2262039 0.2610724 我不知道从哪里可以找到比例之间的差异的置信区间(即平均治疗效果)。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.