Questions tagged «inference»

从样本数据得出有关种群参数的结论。参见https://en.wikipedia.org/wiki/Inference和https://en.wikipedia.org/wiki/Statistical_inference

3
研究人员1运行1000个回归,研究人员2仅运行1,两者都得到相同的结果-他们应该做出不同的推论吗?
想象一个研究人员正在探索一个数据集并运行1000个不同的回归,他发现其中一个有趣的关系。 现在想象一下,具有相同数据的另一位研究人员 仅进行了1次回归,结果发现另一位研究人员进行了1000次回归才能找到相同的结果。研究者2不认识研究者1。 研究人员1是否应做出与研究人员2不同的推论?为什么?例如,研究人员1应该执行多重比较校正,而研究人员2不应该执行多重比较校正吗? 如果研究人员2首先向您显示了他的单一回归,您将做出什么推论?如果该研究人员1向您显示了他的结果之后,您是否应该更改自己的推断?如果是这样,那为什么重要呢? PS 1:如果谈论假设研究者使问题变得抽象,请考虑一下:假设您使用最佳方法对论文进行了一次回归。然后,另一位研究人员使用相同的数据探索了1000种不同的回归,直到发现与您运行的完全相同的回归。你们两个应该推论吗?两种情况的证据是否相同?如果您知道其他研究人员的结果,是否应该更改自己的推论?公众应如何评估两项研究的证据? PS 2:请尽量具体,并在可能的情况下提供数学/理论上的依据!

4
可以使用ARIMA对趋势平稳序列进行建模吗?
我对使用ARIMA(X)进行建模所需的平稳序列有疑问/困惑。我在推理(干预效果)方面考虑的更多,但我想知道预测与推理是否会对响应产生任何影响。 题: 我阅读的所有介绍性资源都指出该系列需要固定下来,这对我来说很有意义,这就是有马中的“ I”出现的地方(与众不同)。 让我感到困惑的是,ARIMA(X)中趋势和漂移的使用以及对平稳需求的暗示(如果有)。 使用常数/漂移项和/或趋势变量作为外生变量(即加“ t”作为回归变量)是否否定了序列是平稳的要求?答案是否不同取决于序列是否具有单位根(例如adf检验)或具有确定性趋势但没有单位根? 要么 在使用ARIMA(X)之前,通过微分和/或去趋势使序列始终保持静止吗?

1
混合效应模型中固定效应的推论
我已经关联了数据,并且正在使用逻辑回归混合效应模型来估计感兴趣的预测变量的个体水平(条件)效应。我知道对于标准边际模型,使用Wald检验推断模型参数对于似然比和得分检验是一致的。它们通常大致相同。因为Wald易于计算并且可以在R输出中使用,所以我用了99%的时间。 但是,对于混合效果模型,我很感兴趣,因为固定效果的Wald检验(在R的模型输出中报告)和“人工”似然比检验之间存在巨大差异,这涉及实际拟合简化模型。凭直觉,我可以理解为什么这会有很大的不同,因为在简化的模型中,随机效应的方差被重新估计,并且会极大地影响可能性。 有人可以解释 对于固定效果,如何在R中计算Wald检验统计量? 混合效应模型中估计模型参数的信息矩阵是什么?(和从中计算Wald测试统计信息的mx相同吗?) 在我描述的案例中,两次测试的结果在解释上有什么区别?哪些通常是动机并在文献中用于推理?

1
使用pymc进行贝叶斯网络推断(初学者的困惑)
我目前正在Daphne Koller在Coursera上参加PGM课程。这样,我们通常将贝叶斯网络建模为变量的因果关系图,这些变量是观察数据的一部分。但是在PyMC教程和示例中,我通常看到它的建模方式与PGM或至少我感到困惑。在PyMC中,任何观察到的真实世界变量的父母通常都是您用来对变量建模的分布参数。 现在我的问题确实是一个实际的问题。假设我有3个变量用于观察数据(A,B,C)(仅出于此目的,假设它们都是连续变量)。从某些领域的知识来看,可以说A和B导致C。因此,我们在这里有一个BN-A,B是父母,C是孩子。现在从BN方程P(A,B,C)= P(C | A,B)* P(A)* P(B) 我可以说A和B是一些具有一定mu和sigma的正态分布,但是如何建模P(C | A,B)?我想学习的一般想法是如何使用PyMC学习此BN,以便可以查询BN。还是我必须以某种方式用模型的参数来增加BN。 使用pymc可以解决此问题吗?还是我的基本原理有误? 任何帮助,将不胜感激!

1
如果网球比赛是一个大型比赛,那么多少场比赛才能达到相同的准确性?
网球有一个独特的三层得分系统,我想知道从比赛的角度来看,这是否有任何统计学上的好处,以确定更好的球员。 对于那些不熟悉的人,通常情况下,只要您有2分的领先优势(通常是4-2,则获胜,但4-3则需要再增加1分,然后保持直到一名玩家领先2)。 一组是一组游戏,一组首先赢得6局,再次必须获得2局,除非这次是特殊的决胜局游戏,而不是继续进行(温网的最后一组等)。 ..) 根据比赛的不同,比赛将首先获得2到3套冠军。 现在,网球也很奇怪,因为比赛不公平。对于任何给定的点,服务器都具有巨大的优势,因此服务器交替进行每个游戏。 在决胜局游戏中,发球在每分之后交替进行,这是第一至7分,再次领先2分。 假设玩家A有可能在其发球和接收到时赢得积分。p [Rpspsp_sprprp_r 问题是这样的,假设我们 A)刚打网球是一项大型的“ N场最佳比赛”,多少场比赛的准确度与正常的5套网球相同 B)只是将网球作为一项重要的决胜局游戏,有多少分能像平常的5盘网球那样获得最佳准确性? 显然,这些答案将取决于和值本身,因此也很高兴知道p [Rpspsp_sprprp_r C)假设常数,是正常网球的预期比赛次数和得分是多少p [Rpspsp_sprprp_r 定义“准确性” 如果我们假设两个玩家的技能保持不变,那么如果他们玩了无限长的时间,那么无论玩法如何,一个或其他玩家几乎肯定会获胜。该球员是“正确”的赢家。我很确定正确的赢家是的玩家。pr+ps>1pr+ps>1p_r+p_s > 1 一种更好的比赛方式是,在相同的得分点上更频繁地产生正确的获胜者,或者相反,在很少的得分中以相同的概率产生正确的胜者。


2
在贝叶斯推断中,为什么某些项从后验预测中删除?
在Kevin Murphy 对高斯分布的共轭贝叶斯分析中,他写道,后验预测分布是 p (x ∣ D )= ∫p (X | θ )p (θ | d )dθp(x∣D)=∫p(x∣θ)p(θ∣D)dθ p(x \mid D) = \int p(x \mid \theta) p(\theta \mid D) d \theta 其中是适合模型的数据,而是看不见的数据。我不明白的是为什么对的依赖性在积分的第一项中消失了。使用基本的概率规则,我期望:dDDXxxdDD p (a )p (a ∣ b )p (x ∣ D )= ∫p (a ∣ c )p (c )dC= ∫p …


2
贝叶斯方法本质上是顺序的吗?
也就是说,要使用频繁性方法进行顺序分析(您无法提前确切地知道要收集多少数据),需要特别注意;您不能仅在p值变得足够小或置信区间变得足够短之前收集数据。 但是,在进行贝叶斯分析时,这是否值得关注?我们可以自由地做诸如收集数据之类的事情,直到可信间隔变得足够小时吗?


2
为什么“ X中的错误”模型没有得到更广泛的使用?
当我们计算回归系数的标准误差时,我们没有考虑设计矩阵的随机性。例如,在OLS中,我们将为XXXVAR (β^)变种(β^)\text{var}(\hat{\beta})var ((XŤX)− 1XŤÿ)= σ2(XŤX)− 1变种((XŤX)-1个XŤÿ)=σ2(XŤX)-1个\text{var}((X^TX)^{-1}X^TY) = \sigma^2(X^TX)^{-1} 如果将视为随机数,则总方差定律在某种意义上也将要求的方差也有其他贡献。即XXXXXX VAR (β^)= var (E(β^| X))+ E(var (β^| X))。变种(β^)=变种(Ë(β^|X))+Ë(变种(β^|X))。\text{var}(\hat{\beta}) = \text{var}(E(\hat{\beta}|X)) + E(\text{var}(\hat{\beta}|X)). 如果OLS估计量确实是无偏的,则第一项就消失了,因为期望是一个常数。第二项实际上变为:。σ2COV (X)− 1σ2冠状病毒(X)-1个\sigma^2 \text{cov}(X)^{-1} 如果已知的参数模型,为什么不用实际的协方差估计替换。例如,如果是随机治疗分配,则二项式方差应该是更有效的估计?XXXXŤXXŤXX^TXXXXË(X)(1 − E(X))Ë(X)(1个-Ë(X))E(X)(1-E(X)) 我们为什么不考虑使用灵活的非参数模型来估计OLS估计中可能的偏差来源,并适当考虑第一个总定律方差项设计敏感性(即的分布)”吗?XXXVAR (è(β^| X))变种(Ë(β^|X))\text{var}(E(\hat{\beta}|X))

2
最大似然参数偏离后验分布
我有一个似然函数大号(d| θ)L(d|θ)\mathcal{L}(d | \theta)为我的数据的概率ddd给出一些模型参数θ∈RNθ∈RN\theta \in \mathbf{R}^N,我想估计。假设先验参数平坦,则似然度与后验概率成正比。我使用MCMC方法来采样这种可能性。 查看生成的收敛链,我发现最大似然参数与后验分布不一致。例如,对于一个参数的边缘化后验概率分布可能是θ0∼N(μ=0,σ2=1)θ0∼N(μ=0,σ2=1)\theta_0 \sim N(\mu=0, \sigma^2=1),而值θ0θ0\theta_0在最大似然点是θML0≈4θ0ML≈4\theta_0^{ML} \approx 4,基本上是几乎最大值θ0θ0\theta_0通过MCMC采样器遍历。 这是一个说明性的例子,不是我的实际结果。实际分布要复杂得多,但是某些ML参数在其各自的后验分布中具有类似的不太可能具有p值。注意,我的一些参数的有界(例如0≤θ1≤10≤θ1≤10 \leq \theta_1 \leq 1); 在范围内,先验总是一致的。 我的问题是: 这样的偏差本身就是问题吗?显然,我不希望ML参数与它们的每个边缘化后验分布的最大值完全一致,但是从直觉上来说,感觉它们也不应该在尾部深处发现。这种偏离会自动使我的结果无效吗? 这是否一定有问题,在数据分析的某个阶段是否可能是特定病理的症状?例如,是否有可能做出一般性的陈述,说明这种偏差是由不正确的收敛链,不正确的模型还是对参数的过度约束引起的?

1
是否应使用自由度校正来推断GLM参数?
这个问题是受到马丁(Martijn)在这里的回答的启发。 假设我们为一个像二项式或泊松模型这样的单参数系列拟合了GLM,并且它是一个完全似然过程(相对于拟泊松模型)。然后,方差是平均值的函数。对于二项式:和Poisson。var [ X] = E[ X] E[ 1 - X]变种[X]=Ë[X]Ë[1个-X]\text{var}[X] = E[X]E[1-X]var [ X] = E[ X]变种[X]=Ë[X]\text{var}[X] = E[X] 与线性回归时残差呈正态分布的情况不同,这些系数的有限精确采样分布是未知的,它可能是结果和协变量的复杂组合。此外,使用GLM的均值估算值,可以用作结果方差的插件估算值。 但是,像线性回归一样,系数具有渐近正态分布,因此在有限样本推论中,我们可以用正态曲线近似其采样分布。 我的问题是:通过对有限样本中系数的样本分布使用T分布近似值,我们可以获得任何收益吗?一方面,我们知道方差,但我们不知道确切的分布,所以当引导程序或折刀估计器可以适当地解决这些差异时,T近似似乎是错误的选择。另一方面,在实践中,也许只偏爱保守的T分布。

1
假设检验和科学方法
阅读该主题的答案,我开始怀疑假设检验与科学方法之间的关系。虽然我对两者都有很好的了解,但我很难绘制它们之间的精确联系。 从高层次上讲,科学方法可以归结为: 做出猜想和假设(理论) 根据这一理论做出预测 进行实验和观察 测试并接受新理论,如果 数据比其他理论更准确地符合预测 新理论并不比其他可能的替代方案复杂 从高层次上看,我认为科学方法遵循的是“假设是否合格”方法,这与统计假设检验中的“如果不合适则拒绝”方法形成对比。这个对吗?如果是这样,为什么会这样呢?他们不是从根本上追求同一目标吗?推断最能解释观察结果的理论或模型?

2
为什么使用横截面数据来推断/预测纵向变化是一件坏事?
我正在寻找希望存在的论文,但不知道是否存在。这可能是一组案例研究,和/或概率论的一个论据,关于为什么使用横截面数据来推断/预测纵向变化可能是一件坏事(即不一定如此,但可以如此)。 我已经从很多方面看到了这个错误:有人推断,由于英国的富人出行更多,所以随着社会的富裕起来,整个人口的出行也将增加。事实证明,这种推论在很长一段时间内都是不正确的-超过十年。这与家庭用电情况类似:横截面数据表明随着收入的增加而大量增加,这种增加不会随着时间的推移而显现。 有几件事发生,包括队列效应和供应方约束。 拥有一个参考文献来汇编这样的案例研究将非常有用;和/或使用概率论来说明为什么使用横截面数据来推断/预测纵向变化会产生非常非常的误导。 是否存在这样的论文,如果存在,那是什么?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.