Questions tagged «hypothesis-testing»

假设检验评估数据是否与给定假设不一致,而不是随机波动的影响。


6
比较来自两个不同随机森林模型的R平方
我正在R中使用randomForest包来开发随机森林模型,以试图解释“宽”数据集中的连续结果,其预测因子比样本多。 具体来说,我正在拟合一个RF模型,允许该过程从大约75个我认为重要的预测变量中进行选择。 我正在使用先前在此处发布的方法,测试该模型对保留测试集的实际结果的预测效果如何,即 ...或在R中: 1 - sum((y-predicted)^2)/sum((y-mean(y))^2) 但是现在我可以添加大约25个预测变量。当使用〜100个预测变量集时,R²较高。我要统计测试,换句话说,使用set〜100预测的时候,做了模型试验显著更好比使用〜75个预测模型拟合测试数据。即,测试射频模型在整个数据集上的拟合度所产生的R²明显高于测试射频模型在缩减后的数据集上进行拟合所产生的R²。 这对我来说很重要,因为这是试验数据,要获得额外的25个预测指标非常昂贵,而且我需要知道是否应该在较大的后续研究中为这些预测指标进行测量。 我正在尝试考虑某种重采样/置换方法,但是什么也没想到。

4
什么测试可以比较社区组成?
希望这个新手问题是该网站的正确问题: 假设我想比较两个地点A,B的生态群落组成。我知道这三个地点都有狗,猫,牛和鸟,因此我在每个地点都采样了它们的丰度(我实际上没有“每个位置的每个动物的预期“数量”)。 如果我算一下,每个位置的每只动物有五只,那么A和B非常“相似”(实际上,它们是“相同”)。 但是,如果我在A站点发现100条狗,5只猫,2头牛和3只鸟。在B站点发现5条狗,3只猫,75头牛和2只鸟。那么我会说A和B站点“不同” ,即使它们具有完全相同的物种组成。 (我阅读了Sorensen's和Bray-Curtis指数,但看起来他们只考虑狗,猫等的不在/在场,而不考虑它们的丰度。) 是否有统计检验确定这一点?

3
零膨胀连续数据的假设检验
非常感谢您对以下问题的建议: 我有一个很大的连续数据集,其中有很多零(〜95%),我需要找到最佳方法来测试它的某些子集是否“有趣”,即,似乎不是从与其余的部分。零膨胀来自以下事实:每个数据点均基于具有零和真实零的计数测量值,但是结果是连续的,因为它考虑了由计数加权的其他一些参数(因此,如果计数为零,则结果为也是零)。 最好的方法是什么?我觉得Wilcoxon甚至蛮力置换测试都不足够,因为它们被这些零值所扭曲。专注于非零测量也会删除非常重要的真实零。计数数据的零膨胀模型已经很好地开发,但是不适合我的情况。 我考虑过将Tweedie分布拟合到数据,然后在response = f(subset_label)上拟合glm。从理论上讲,这似乎是可行的,但我想知道(a)这是否过大,以及(b)是否仍隐含地假设所有零均为样本零,即是否以与排列相同的方式(最多)被偏置? 直观地讲,听起来好像有某种层次结构设计,该结构结合了基于零比例的二项式统计量,例如,基于非零值(或者更好的是,非零值再加上零的一部分)计算出的Wilcoxon统计量零)。听起来像贝叶斯网络... 希望我不是第一个遇到这个问题的人,所以如果您能向我指出合适的现有技术,将不胜感激。 非常感谢!

2
将混合模型(作为随机效应)与简单的线性模型(作为固定效应)进行比较
我正在完成对大量数据的一些分析。我想采用在工作的第一部分中使用的线性模型,并使用线性混合模型(LME)重新拟合它。除了将模型中使用的变量之一用作随机效应外,LME非常相似。该数据来自一小群受试者(约10个)中的许多观察值(> 1000),我知道,将受试者的效果建模为随机效果更好(这是我要转移的变量)。R代码如下所示: my_modelB <- lm(formula = A ~ B + C + D) lme_model <- lme(fixed=A ~ B + C, random=~1|D, data=my_data, method='REML') 一切运行正常,结果极为相似。如果我可以使用RLRsim或AIC / BIC之类的东西来比较这两种模型并确定最合适的模型,那就太好了。我的同事们不想举报LME,因为尽管我认为LME是更合适的模型,但是没有一种容易获得的选择“更好”的方法。有什么建议么?


2
检验三位一体的可能性最大:面对矛盾的结论该怎么办?
在最大似然估计的上下文中,Wald,似然比和拉格朗日乘数检验在渐近上是等价的。但是,对于小样本,它们往往会有很大差异,在某些情况下,它们会得出不同的结论。 如何根据拒绝空值的可能性对它们进行排名?如果测试的答案不一致,该怎么办?您能选择一个给出所需答案的方法吗?或者是否有关于如何进行的“规则”或“指南”?

4
如何使用Python统计证明列是否具有分类数据
我在python中有一个数据框,我需要在其中查找所有类别变量。检查列的类型并不总是可行的,因为int类型也可以是分类的。 因此,我在寻找正确的假设检验方法以识别列是否为分类方面寻求帮助。 我正在尝试进行卡方检验以下的测试,但是我不确定这是否足够好 import numpy as np data = np.random.randint(0,5,100) import scipy.stats as ss ss.chisquare(data) 请指教。


3
评估PDF估算方法的最佳方法
我希望检验一些我认为比我所见过的更好的想法。我可能是错的,但我想通过更确定的观察来检验我的想法并消除怀疑。 我一直想做的事情如下: 分析性地定义一组分布。其中一些很简单,例如高斯,统一或高帽。但是其中有些必须是困难且具有挑战性的,例如Simpsons发行。 根据这些分析分布实施软件,并使用它们生成一些样本。 由于这些分布是经过分析定义的,因此,按照定义,我已经知道它们的真实PDF。这很棒。 然后,我将针对以上示例测试以下PDF估计方法: 现有的PDF估计方法(例如具有各种内核和带宽的KDE)。 我认为值得尝试的我自己的想法。 然后,我将根据真实的PDF测量估计的误差。 然后,我将更好地了解哪种PDF估计方法是好的。 我的问题是: Q1:我上面的计划有什么改进吗? Q2:我发现很难解析地定义许多真实的PDF。是否已经有了许多分析定义的真实PDF的完整列表,这些PDF在各种困难(包括非常困难的困难)下都可以在这里重用?

1
在统计假设检验中,原假设 H0H0H_0 通常采用(至少在我读过的书中)的形式: H0:H0:θ=θ0θ≤θ0H0:θ=θ0H0:θ≤θ0 \begin{align*} H_0:&\theta=\theta_0\\ H_0:&\theta\le\theta_0 \end{align*} 要么 H0:θ1≤θ≤θ2H0:θ1≤θ≤θ2 H_0:\theta_1\le\theta\le\theta_2 只是约定俗成的 H0H0H_0关闭了吗?还是还有其他原因?

2
当解释变量之一可能具有二次项和三次项时,我该如何建模?
我衷心希望我对这个问题的表述方式能够得到明确的回答-如果没有,请让我知道,我会再试一次!我还应该注意,我将使用R进行这些分析。 我plant performance (Ys)怀疑有几种措施受到了我实施的四种治疗的影响- flower thinning (X1), fertilization (X2), leaf clipping (X3)和biased flower thinning (X4)。对于所有可能的Y,N至少为242,因此我的样本量很大。所有地块都进行了稀疏或不间断处理,但每个地块也经历了其他三种处理方式中的一种(也只有一种)(或没有,也有对照地块)。该设计的目的是测试其他三种处理是否能够“掩盖”或“增强”细化效果。因此,通过设计,后三种处理(X2-X4)不能相互作用彼此,因为他们没有交叉,但他们可以每疏花互动-他们可能会做。 我的明确假设是:1)开花稀疏将很重要,并且2)X1*X2, X1*X3, and X1*X4,花卉稀疏与其他三种处理之间的相互作用项也将很重要。就是说,疏花应该很重要,但是其他三种处理方式却应该大大改变疏花的方式。 我想将所有这些信息包括在混合模型中: Y ~ X0 + X1 + X2 + X3 + X4 + X1*X2 + X1*X3 + X1*X4 + (Up to three random effects) 但是有一个困扰:我有充分的理由相信细化对Y的影响是非线性的。它们可能是二次方的,但在某些情况下甚至可能是三次方的。这是因为细化对性能的影响很可能在更高的细化水平下更快地增加。如果我尝试通过为X1添加二次项和三次项来通过上述等式对这种非线性关系进行建模,那么我不确定如何对交互项进行建模-我应该包括X1的所有可能组合(X1)^ 2,以及(X1)^ 3 * X2,X3和X4?因为即使有我拥有的数据点的数量,这似乎也要尝试估计很多参数,而且我不确定如何解释得到的结果。就是说,我没有生物学上的理由认为这将是对情况进行建模的不明智的方式。 因此,对于如何解决此问题,我有三点想法: 首先拟合一个较小的模型,例如Y …


1
使用置换测试的好处是什么?
当通过检验统计量检验某些零假设与替代假设时,其中,对进行置换,对置换集进行置换检验,我们有了一个新的统计量 ü(X)U(X)U(X)X= {X一世,。。。,Xñ}X={xi,...,xn}X = \{ x_i, ..., x_n\}GGGXXXŤ(X):=#{ π∈ ģ :ù(πX)≥ ü(X)}| G |。T(X):=#{π∈G:U(πX)≥U(X)}|G|. T(X) := \frac{\# \{\pi \in G: U(\pi X) \geq U(X)\}}{|G|}. 与不使用置换测试相比,使用置换测试有什么好处?即,排列测试工作时是什么样的? 什么条件可以实现?例如关于检验统计量和/或原假设的某些条件?üUU 例如, 是否应 是等于基于p值,用于样品?如果是,为什么?(也值得参考)Ť(X)T(X)T(X)ü(X)U(X)U(X)XXX 的p值定义为。如果置换检验是为了估计U(X)的置换分布| X = x,T(X)等于X = x处U(X)的p值吗?特别是,在零H中可能存在多个分布,并且T(X)不会一一考虑零分布,然后取\ sup_ {F \ in H}和\ inf_ {c:U(x) \ geq c}。ü(X)U(X)U(X)信息Ç ∈ [R :ù(X )≥ ÇSUPF∈ …

2
这个单一值与该分布相符吗?
这似乎是一个非常幼稚的问题,但我很难看到答案。 我有一组30个值。我独立地获得了第31个值。空假设是第31个值是同一分布的一部分。另一种选择是,它与众不同。我想要某种p值或可能性度量。 我有一些想法: 这类似于想要进行两个样本的t检验-除了对于第二个样本,我只有一个值,并且30个值不一定呈正态分布。 如果我有30个测量值而不是30个测量值,则单个测量值的等级可以提供一些有用的信息。 如何计算这种可能性或p值? 谢谢!亚尼克

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.