Questions tagged «permutation-test»

基于与原假设相符的数据重新排列的统计检验。

1
在两个样本的置换测试中将尾部加倍
假设我们有两个样本,我们希望确定它们是否来自相同的分布,样本A,B由一些整数组成。 如果我们使用两个样本的置换检验来测试这一点,特别是通过查看样本均值差异与观察到的差异一样极端的置换:是否有理由认为我们可以计算出两尾p-通过观察一条尾巴并加倍概率来获得价值? 这就是我在讲义中似乎要说的,但是我不明白为什么我们可以假设尾巴是对称的(或者为什么它不需要这种假设)。没有解释。

1
排列检验将单个样本与平均值进行比较
当人们实施置换测试以将单个样本与平均值进行比较时(例如,您可能会使用置换t检验),均值将如何处理?我已经看到了需要进行均值检验和样本才能进行置换测试的实现,但是目前尚不清楚它们实际上是在做什么。有没有一种有意义的方法可以对一个样本与假设的均值进行置换检验(例如t检验)?或者,它们只是在引擎盖下默认不进行置换测试?(例如,尽管调用了排列函数或设置了排列测试标志,但默认为标准t检验或类似函数) 在标准的两样本置换测试中,一个样本将具有两组并将标签的分配随机化。但是,当一个“组”是假设平均值时,该如何处理?显然,假设均值本身没有样本量。那么,将均值转换为排列格式的典型方法是什么?“平均”样本是否假定为单点?与样本组大小相等的样本?无限大小的样本? 假设一个假设均值是假设的,我会说它在技术上要么具有无限支持,要么具有您想要为其提供的任何支持。但是,这些都不对实际计算非常有用。值均等于平均值​​的大小相等的样本有时似乎是通过某些测试完成的(例如,只需用假定的位置填充对的另一半)。这很有道理,因为这是等长样本,您将看到假设均值正确无偏差。 所以我的问题是这样的:在实践中,当第二组是平均值(或相似的抽象假定值)时,人们是否真的会模拟置换测试样式标签的随机化?如果是这样,人们在这样做时如何处理标签随机化?

1
使用置换测试的好处是什么?
当通过检验统计量检验某些零假设与替代假设时,其中,对进行置换,对置换集进行置换检验,我们有了一个新的统计量 ü(X)U(X)U(X)X= {X一世,。。。,Xñ}X={xi,...,xn}X = \{ x_i, ..., x_n\}GGGXXXŤ(X):=#{ π∈ ģ :ù(πX)≥ ü(X)}| G |。T(X):=#{π∈G:U(πX)≥U(X)}|G|. T(X) := \frac{\# \{\pi \in G: U(\pi X) \geq U(X)\}}{|G|}. 与不使用置换测试相比,使用置换测试有什么好处?即,排列测试工作时是什么样的? 什么条件可以实现?例如关于检验统计量和/或原假设的某些条件?üUU 例如, 是否应 是等于基于p值,用于样品?如果是,为什么?(也值得参考)Ť(X)T(X)T(X)ü(X)U(X)U(X)XXX 的p值定义为。如果置换检验是为了估计U(X)的置换分布| X = x,T(X)等于X = x处U(X)的p值吗?特别是,在零H中可能存在多个分布,并且T(X)不会一一考虑零分布,然后取\ sup_ {F \ in H}和\ inf_ {c:U(x) \ geq c}。ü(X)U(X)U(X)信息Ç ∈ [R :ù(X )≥ ÇSUPF∈ …

1
Fisher精确检验(置换检验)的功效令人惊讶
我遇到了所谓的“精确测试”或“置换测试”的自相矛盾行为,其原型是费舍尔测试。这里是。 想象一下,您有两组,每组400个人(例如400名对照vs 400例),以及一个具有两种模式(例如暴露/未暴​​露)的协变量。在第二组中只有5个暴露的个体。Fisher测试是这样的: > x <- matrix( c(400, 395, 0, 5) , ncol = 2) > x [,1] [,2] [1,] 400 0 [2,] 395 5 > fisher.test(x) Fisher's Exact Test for Count Data data: x p-value = 0.06172 (...) 但是现在,第二组(病例)存在某种异质性,例如疾病的形式或募集中心。它可以分为4组,每组100个人。这样的事情可能会发生: > x <- matrix( c(400, 99, 99 , 99, 98, …

1
排列检验:选择检验统计量的条件
我经常使用排列测试,并且喜欢它们的简单性。我从Good所著的《重采样方法》一书中学到了很多东西,其中作者在整个示例中选择测试统计数据时似乎很有创造力。同样,该帖子给人的印象是,可以很大程度地选择测试统计信息。 我确实想知道测试统计量是否符合理论要求。还是只要可以直观地使用并且具有良好的I / II类型错误率的统计量,我们就可以使用它吗? 例如,当由于非正态总体而使用置换检验而不是t检验时,我已经看到很多次仍然从t统计量获得置换检验p值。尽管不一定是错误的,但考虑到Student t分布的起源,这似乎是一个奇怪的选择。


2
我可以使用置换测试来避免比例背景下的多重比较问题吗?
我正在评估5种不同方法预测特定二进制结果(称为“成功”和“失败”)的有效性。数据如下所示: Method Sample_Size Success Percent_Success 1 28 4 0.14 2 19 4 0.21 3 24 7 0.29 4 21 13 0.61 5 22 9 0.40 我想对这5种方法进行测试,以评估这些方法的相对优势。换句话说,我想按照性能的顺序对方法进行排序,方法是方法1>方法2> ...方法5。为避免出现多个比较的问题,我计划按照以下几行进行置换测试: 步骤1:汇总所有数据,以使总样本量为114,共获得37次成功。 步骤2:将数据随机分为5组,相应的样本大小分别为28、19、24、21和22。 步骤3:如果从步骤2中观察到的Percent_Success顺序与我的数据顺序一致,则增加一个计数器。 步骤4:重复步骤2和3多次(例如10000)。 所需的p值=最终计数器值/ 10000。 问题: 以上程序可以吗? R中有什么可以让我执行上述测试的吗? 任何改进或替代方法的建议都会有所帮助。

3
我们如何为置换测试的参数创建置信区间?
置换检验是基于从原始数据中随机抽取的置换重采样进行的显着性检验。引导重采样是在没有替换的情况下绘制的,而引导程序样本是在替换后绘制的。这是我在R中进行的简单置换测试的示例。(欢迎您发表评论) 置换测试具有很大的优势。他们不需要特定的总体形状,例如正态分布。它们适用于各种统计数据,而不仅适用于在零假设下具有简单分布的统计数据。无论总体的形状和大小如何,它们都可以给出非常准确的p值(如果使用了足够的排列)。 我还读到,给出一个置信区间和一个测试通常很有用,该测试是使用引导重采样而不是置换重采样创建的。 您能否解释(或仅给出R代码)如何构建置信区间(即,上述示例中两个样本的均值之间的差异)? 编辑 经过一番谷歌搜索,我发现了这有趣的读物。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.