Questions tagged «hypothesis-testing»

假设检验评估数据是否与给定假设不一致,而不是随机波动的影响。

1
如何测试人口中位数?
我有250个单位的样本。分布是不对称的。我想检验一个假设,即人口中位数不同于3.5,因此我认为单样本检验是合适的。我知道Wilcoxon等级检验不适合,因为分布不对称。是否适合使用符号测试?如果不是,任何人都可以推荐其他测试吗?

1
排列检验:选择检验统计量的条件
我经常使用排列测试,并且喜欢它们的简单性。我从Good所著的《重采样方法》一书中学到了很多东西,其中作者在整个示例中选择测试统计数据时似乎很有创造力。同样,该帖子给人的印象是,可以很大程度地选择测试统计信息。 我确实想知道测试统计量是否符合理论要求。还是只要可以直观地使用并且具有良好的I / II类型错误率的统计量,我们就可以使用它吗? 例如,当由于非正态总体而使用置换检验而不是t检验时,我已经看到很多次仍然从t统计量获得置换检验p值。尽管不一定是错误的,但考虑到Student t分布的起源,这似乎是一个奇怪的选择。

3
测试以区分周期性数据和几乎周期性数据
假设我有一些未知功能与域ℝ,我知道要实现像连续性一些合理的条件。我知道在某些等距采样点t_i = t_0 +iΔt且i∈ \ {1,…,n \}的情况下f的确切值(因为数据来自模拟),我可以假设它足够精细来捕获所有f的相关方面,例如,我可以假设在两个采样点之间最多有一个f的局部极值。我正在寻找一个测试,该测试告诉我我的数据是否符合正好是周期性的f,即∃τ:f(t +τ)= f(t)\,∀\,tfffRℝℝfffti=t0+iΔtti=t0+iΔtt_i=t_0 + iΔti∈{1,…,n}i∈{1,…,n}i∈\{1,…,n\}fffffffff∃τ:f(t+τ)=f(t)∀t∃τ:f(t+τ)=f(t)∀t∃τ: f(t+τ)=f(t) \,∀\,t,周期长度有些合理,例如Δt&lt;τ&lt;n⋅ΔtΔt&lt;τ&lt;n·ΔtΔt < τ < n·Δt(但可以想象,如果需要的话,我可以设定更强的约束条件)。 从另一个角度来看,我有数据x0,…,xnx0,…,xn{x_0, …, x_n}并且正在寻找一个测试来回答是否存在周期函数fff(如上所述的满足条件)使得f(ti)=xi∀if(ti)=xi∀if(t_i)=x_i ∀ i。 重要的一点是fff至少非常接近周期性(例如,f(t):=sin(g(t)⋅t)f(t):=sin⁡(g(t)·t)f(t) := \sin(g(t)·t)或f(t):=g(t)⋅sin(t)f(t):=g(t)·sin⁡(t)f(t) := g(t)·\sin(t)与g′(t)≪g(t0)/Δtg′(t)≪g(t0)/Δtg'(t) ≪ g(t_0)/Δt)到这样的程度:只需少量更改一个数据点就足以使数据符合fff是精确的周期性。因此,用于频率分析的标准工具(例如傅立叶变换或分析零交叉)将无济于事。 请注意,我正在寻找的测试可能不会出现概率。 我对如何自己设计这样的测试有一些想法,但是想避免重新发明轮子。因此,我正在寻找现有的测试。

4
可以将Mann-Whitney检验用于Kruskal-Wallis之后的事后比较吗?
我进行了模拟,将动物放置在敌对环境中,并定时观察使用某种生存方法可以生存多长时间。它可以使用三种方法来生存。我使用每种生存方法对动物进行了300次模拟。所有模拟都在相同的环境中进行,但存在一定的随机性,因此每次都不同。我计算每次模拟中动物存活多少秒。活得更长些更好。我的数据如下所示: Approach 1, Approach 2, Approach 2 45,79,38 48,32,24 85,108,44 ... 300 rows of these 我不确定在此之后所做的一切,所以请让我知道我是否在做愚蠢和错误的事情。我试图找出使用特定方法在寿命上是否存在统计差异。 我对每个样本都进行了Shapiro测试,结果以很小的p值返回,因此我认为数据没有被标准化。 行上的数据彼此之间没有关系。每个模拟使用的随机种子是不同的。结果,我认为数据没有配对。 由于数据未标准化,不成对并且存在两个以上的样本,因此我进行了Kruskal Wallis检验,得出p值为0.048。然后,我继续工作,选择了曼·惠特尼。真的不确定是否应该在这里使用Mann Whitney。 我通过执行曼恩·惠特尼(Mann Whitney)测试将每种生存方法与其他方法进行了比较,即{(方法1,方法2),(方法1,方法3),(方法2,方法3)}。使用双尾检验在两对之间(方法2,方法3)之间没有统计学意义的发现,但是使用单尾检验存在显着性差异。 问题: 我不知道像这样使用Mann Whitney是否有意义。 我不知道我应该用一两个尾巴的曼·惠特尼(Mann Whitney)。

2
围绕非显着效应的狭窄置信区间能否为无效提供证据?
假设拒绝拒绝null表示null为真显然是错误的。但是,在一个情况下空未被拒绝和相应的置信区间(CI)是窄和围绕着0,这是否没有提供证据为空? 我有两种想法:是的,实际上,这将提供证据表明效应几乎为0。但是,在严格的假设检验框架中,似乎无效效应及其对应的CI根本无法推理。那么,当CI的点估计不重要时,它的含义是什么?它是否也不能用于推理,还是可以像前面的示例中那样用于量化无效的证据? 鼓励提供具有学术参考意义的答案。

2
为什么0.05 <p <0.95的结果称为假阳性?
编辑:我的问题的基础是有缺陷的,我需要花一些时间弄清楚它是否甚至可以说得通。 编辑2:澄清一下,我认识到p值不是零假设的概率的直接量度,但是我假设p值越接近1,则假设就越有可能被选择用于相应零假设为真的实验测试,而p值越接近0,则被选择用于相应零假设为假的实验测试的可能性就越大。除非所有假设(或为实验选择的所有假设)的集合在某种程度上是病理性的,否则我看不到这是错误的。 编辑3:我认为我仍然没有使用明确的术语来问我的问题。当彩票号码被读出并与彩票一一对应时,情况就会发生变化。您赢了的概率不会改变,但是您可以关闭收音机的概率却不会改变。实验完成时也会发生类似的变化,但是我感到我使用的术语-“ p值会更改选择正确假设的可能性”-不是正确的术语。 编辑4:我收到了两个非常详尽而翔实的答案,其中包含大量信息供我参考。我现在将它们都投票给我,然后在我从两个答案中学到足够多的知识后知道他们已经回答了我的问题或使我的问题无效时,再回来接受它们。这个问题打开了比我原本希望吃的蠕虫还要大得多的蠕虫罐。 在我读过的论文中,我看到经过验证的p&gt; 0.05的结果称为“假阳性”。但是,当实验数据的ap &lt;0.50低但大于0.05且不是零假设和p时,我选择一个假设以错误的相应零假设进行检验的可能性是否更大?考虑到@NickStauner 链接中指出的不对称性,研究假设在0.05 &lt;p &lt; 0.95之间的任何地方统计上不确定/无关紧要(鉴于常规的统计显着性临界值)。 让我们将数字称为A,并将其定义为p值,该值表示您为实验/分析选择了真实零假设的可能性相同,p值为0.05表示您的可能性为我们为您的实验/分析选择了一个真实的非零假设。0.05 &lt;p &lt;只是说:“您的样本量不足以回答问题,在您获得更大的样本并获得统计数据之前,您将无法判断应用程序/现实世界的重要性意义整理出来了吗? 换句话说,当且仅当p&gt; A时才将结果绝对确定为假(而不是仅仅不受支持)是否正确? 这对我来说似乎很简单,但是如此广泛的使用告诉我我可能是错的。我是 a)误解了数学, b)抱怨一种无害(如果不是完全正确)的惯例, c)完全正确,或者 d)其他? 我认识到这听起来像是在征求意见,但这似乎是一个问题,它在数学上有明确的正确答案(一旦设定了有效截断值),那么我或(几乎)其他所有人都会出错。

1
测试两个二项分布的样本是否符合相同的p
假设我已经完成: ñ1个ñ1个n_1独立试验,成功率未知,观察到成功。p1个p1个p_1ķ1个ķ1个k_1 ñ2ñ2n_2独立试验,成功率未知,观察到成功。p2p2p_2ķ2ķ2k_2 如果现在但仍然未知,则对于给定的观测的概率(反之亦然)与,所以如果我要测试p_1 \ neq p_2,则只需要查看观察值对应分布的哪个分位数即可。p1个=p2= : pp1个=p2=:pp_1 = p_2 =: pp (ķ2)p(ķ2)p(k_2)ķ2ķ2k_2ķ1个ķ1个k_1∫1个0B (ñ1个,p ,ķ1个)B (ñ2,p ,ķ2)d p =1个ñ1个+ñ2+ 1(ñ1个ķ1个)(ñ2ķ2)(ñ1个+ñ2ķ1个+ķ2)− 1∫01个乙(ñ1个,p,ķ1个)乙(ñ2,p,ķ2)dp=1个ñ1个+ñ2+1个(ñ1个ķ1个)(ñ2ķ2)(ñ1个+ñ2ķ1个+ķ2)-1个\int_0^1 B(n_1,p,k_1) B(n_2, p, k_2) \text{d}p = \frac{1}{n_1+n_2+1}\binom{n_1}{k_1}\binom{n_2}{k_2}\binom{n_1+n_2}{k_1+k_2}^{-1}p1个≠p2p1个≠p2p_1 \neq p_2 到目前为止,是为了重新发明轮子。现在我的问题是我无法在文献中找到它,因此我想知道:此测试的技术术语是什么?

1
对3个样本的比例相等性进行假设检验
我有一个带有两个列的手机客户信息数据集。第一列包含某个帐户所属的特定类别(A,B或C),第二列包含该帐户是否已取消的二进制值。例如 A | cancelled C | active B | active A | cancelled 我想要做的是提出某种假设检验,以测试活动账户与已取消账户的类型A,B和C的账户比率是否不同-零假设是它们相同。因此,这就像是对比例的假设检验,只是我不知道如何对3个值进行此操作

3
统计检验以查看关系是线性还是非线性
我有一个示例数据集,如下所示: Volume &lt;- seq(1,20,0.1) var1 &lt;- 100 x2 &lt;- 1000000 x3 &lt;- 30 x4 = sqrt(x2/pi) H = x3 - Volume r = (x4*H)/(H + Volume) Power = (var1*x2)/(100*(pi*Volume/3)*(x4*x4 + x4*r + r*r)) Power &lt;- jitter(Power, factor = 1, amount = 0.1) plot(Volume,Power) 从图中可以看出,在“体积”和“功率”的特定范围之间,关系是线性的,然后,当“体积”变得相对小时,关系变为非线性。有统计检验可以说明这一点吗? 关于对《任择议定书》的答复中显示的一些建议: 此处显示的示例只是一个示例,尽管噪声较大,但我拥有的数据集看起来与此处看到的关系相似。到目前为止,我进行的分析表明,当我分析特定液体的体积时,当体积较小时,信号的功率会急剧增加。因此,可以说我只有一个音量在15到20之间的环境,几乎就像线性关系。但是,通过增加点的范围(即具有较小的体积),我们看到该关系完全不是线性的。我现在正在寻找有关如何统计显示这一点的统计建议。希望这是有道理的。

4
如果我有很多积极的,微不足道的结果,我是否可以测试“ 这些结果中至少是积极的”?
假设我分别对100个不同的人进行了相同的回归分析。我感兴趣的系数是正的(并且彼此之间有很大差异),但在所有100个结果中统计上都无关紧要(假设每个p值= 0.11)。 有没有一种方法可以将这些p值组合起来,以得出“这些结果中至少有80个是阳性”的结论,其意义远大于p = 0.11?我的在线搜索仅显示了我如何通过Fisher或类似测试怎么说“这些结果中至少有1项是肯定的”,但我无法对此结果进行概括。我想测试“ H0 =所有100种效果在0时都相同”对“ HA =至少80种效果是正值”。 我的目标不是说平均有一个正系数,也不是专门测量该系数。我的目标是有意义地证明,至少有80个人面对着一些积极的影响,而不论80个人,以及每个人感受到的影响程度如何。

3
Fisher精确检验中的检验统计量是多少?
对于2 x 2列联表,某些Fisher精确测试使用表(1,1)单元格中的计数作为测试统计量,在零假设下,将具有超几何分布。X1 ,1X1个,1个X_{1,1}X1 ,1X1个,1个X_{1,1} 有人说它的测试统计量是 其中是null下超几何分布的平均值(如上所述)。它还说,p值是根据高计量分布的表格确定的。我想知道是否有一些原因减去均值然后取绝对值?在null下没有超几何分布,是吗?|X1 ,1- μ ||X1个,1个-μ| |X_{1,1} - \mu| μμ\mu|X1 ,1- μ ||X1个,1个-μ||X_{1,1} - \mu|

2
不等方差条件下的Mann-Whitney零假设
我只是对Mann-Whitney U检验的零假设感到好奇。我经常看到它指出零假设是两个总体具有相等的分布。但是我在想-如果我有两个均值相同但方差极不相等的正常群体,则Mann-Whitney检验可能不会检测到这种差异。 我还看到它表明曼·惠特尼检验的原假设是或一个总体(X)的观察结果超过第二总体(Y)的观察结果的概率(在排除并列)等于0.5。这似乎更有意义,但似乎不等同于我陈述的第一个零假设。Pr(X&gt;Y)=0.5Pr(X&gt;Y)=0.5\Pr(X>Y)=0.5XXXYYY 我希望能对此有所帮助。谢谢!


1
未知的p值计算
我最近在调试R脚本时发现很奇怪,作者定义了自己的p值函数 pval &lt;- function(x, y){ if (x+y&lt;20) { # x + y is small, requires R.basic p1&lt;- nChooseK(x+y,x) * 2^-(x+y+1); p2&lt;- nChooseK(x+y,y) * 2^-(x+y+1); pvalue = max(p1, p2) } else { # if x+y is large, use approximation log_p1 &lt;- (x+y)*log(x+y) - x*log(x) - y*log(y) - (x+y+1)*log(2); pvalue&lt;-exp(log_p1); } return(pvalue) …


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.