Questions tagged «hypothesis-testing»

假设检验评估数据是否与给定假设不一致,而不是随机波动的影响。

2
在双向方差分析中交互作用的零假设是什么?
假设我们有两个因子(A和B),每个因子有两个级别(A1,A2和B1,B2)和一个响应变量(y)。 在执行类型的双向ANOVA时: y~A+B+A*B 我们正在测试三个原假设: 因子A的均值没有差异 因子B的均值没有差异 因子A和B之间没有相互作用 写下后,很容易提出前两个假设(对于1来说是)H0:μA1=μA2H0:μA1=μA2H_0:\; \mu_{A1}=\mu_{A2} 但是假设3应该如何表述呢? 编辑:以及如何将其制定为两个以上级别的情况? 谢谢。

4
边缘情况下精度和召回率的正确值是多少?
精度定义为: p = true positives / (true positives + false positives) 对不对,作为true positives和false positives做法0,精度接近1? 召回相同的问题: r = true positives / (true positives + false negatives) 我目前正在实施统计测试,需要计算这些值,有时分母为0,我想知道在这种情况下应返回哪个值。 PS:请原谅,不恰当的标签,我想用recall,precision和limit,但我不能创造新的标签呢。
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

6
我的天气预报员准确吗?
一个困扰我一段时间的问题,我不知道该如何解决: 每天,我的气象员都会有一定百分比的降雨机会(假设计算得出的数字为9000位数,而他从未重复输入数字)。随后的每一天,要么下雨,要么不下雨。 我有多年的数据-pct机会还是下雨。考虑到这位气象员的历史,如果他今晚说明天的下雨机会是X,那么我对下雨的真正可能性的最佳猜测是什么?

2
在检验和检验之间选择
背景:我正在向工作中的同事进行假设检验的介绍,并且对它的大部分内容都了解得很好,但是有一个方面是我将自己束之高阁,试图理解并向他人解释。 这就是我想知道的(如果错误,请更正!) 如果方差已知,则统计量将是正常的;如果方差未知,则遵循分布ttt CLT(中心极限定理):样本平均值的采样分布对于足够大的大约是(对于高度偏斜的分布,可能是,最大可能是)nnn303030300300300 该 -配送可以认为是正常的自由度ttt&gt;30&gt;30> 30 如果满足以下条件,则使用 -test:zzz 已知总体正态和方差(对于任何样本量) 总体正常,方差未知且(由于CLT)n&gt;30n&gt;30n>30 人口二项式,,np&gt;10np&gt;10np>10nq&gt;10nq&gt;10nq>10 如果满足以下条件,则使用检验:ttt 总体正常,方差未知,n&lt;30n&lt;30n<30 不了解总体或方差且,但样本数据看起来正常/通过测试等,因此可以认为总体正常n&lt;30n&lt;30n<30 所以我剩下: 对于样本和(?),不知道有关总体和方差的已知/未知信息。&gt;30&gt;30>30&lt;≈300&lt;≈300<\approx 300 所以我的问题是: 当抽样分布看起来非正态时,您可以假设在什么样本量下(对总体分布或方差一无所知)均值的抽样分布是正态的(即CLT已经加入)?我知道有些发行版需要,但是有些资源似乎说每当时就使用 -test 。n&gt;300n&gt;300n>300zzzn&gt;30n&gt;30n>30 对于我不确定的情况,我想我看一下数据是否正常。现在,如果样本数据看起来正常,我是否应该使用 -test(因为假设总体正常,并且因为)?zzzn&gt;30n&gt;30n>30 我不确定的案例样本数据在哪里看起来不正常呢?在任何情况下,您仍然会使用检验或检验,还是总是希望转换/使用非参数检验?我知道,由于CLT,在的某个值处,均值的采样分布将近似于正态,但是样本数据不会告诉我值是多少。样本数据可能是非正态的,而样本均值遵循正态/。在某些情况下,您会进行转换/使用非参数检验,而实际上均值的采样分布是正态/但您无法分辨吗? tttzzznnnnnntttttt

3
Gentler贝叶斯统计方法
我最近开始阅读Bolstad撰写的“贝叶斯统计概论”第二版。我有一个介绍性的Stats类,主要涵盖统计测试,并且几乎遍历了回归分析中的一类。我还可以使用其他哪些书籍来补充我对这本书的理解? 我已经完成了前100-125页的罚款。之后,这本书开始谈论假设检验,这是我很激动地介绍的内容,但是有几件事情让我失望: 在计算中使用概率密度函数。换句话说,如何评估这样的方程式。 这整个句子是:“假设我们在pi之前使用beta(1,1)。然后给定y = 8,后验密度为beta(9,3)。零假设的后验概率是...”我相信 beta(1,1)指的是平均值为1而标准偏差为1的PDF?我不知道如何将其转换为beta(9,3)作为后验密度函数。 我确实了解先验与后继的概念,并了解如何使用表格手动应用它们。我得到(我认为!)pi代表假定的人口比例或概率。 我不知道如何将其与我每天会遇到的数据联系在一起并获得结果。

2
方差分析中变量的顺序很重要,不是吗?
我是否正确理解,在多元ANOVA中指定变量的顺序会有所不同,但是在进行多元线性回归时顺序并不重要? 因此,假设存在诸如测得的失血量 y和两个分类变量之类的结果 增殖腺切除术的方法 a, 扁桃体切除方法 b。 该模型y~a+b不同于该模型y~b+a(或因此我在R中的实现似乎表明了这一点)。 我是否正确理解这里的术语是方差分析是一种层次模型,因为它在尝试将剩余方差归因于第二因素之前首先将尽可能多的方差归因于第一因素? 在上面的示例中,层次结构是有道理的,因为我总是在进行扁桃体切除术之前先进行腺样体切除术,但是如果一个人有两个没有内在顺序的变量会怎样?

1
非参数检验是否从同一分布中抽取两个样本
我想检验一个假设,即从同一总体中抽取两个样本,而无需对样本或总体的分布进行任何假设。我应该怎么做? 在Wikipedia上,我的印象是Mann Whitney U考试应该是合适的,但实际上似乎对我没有用。 为了具体起见,我创建了一个数据集,其中包含两个样本(a,b),它们大(n = 10000),并从两个非正态(双峰),相似(均值),但不同(标准差)的总体中得出我正在寻找一种测试,可以识别出这些样本不是来自同一群体。 直方图视图: R代码: a &lt;- tibble(group = "a", n = c(rnorm(1e4, mean=50, sd=10), rnorm(1e4, mean=100, sd=10))) b &lt;- tibble(group = "b", n = c(rnorm(1e4, mean=50, sd=3), rnorm(1e4, mean=100, sd=3))) ggplot(rbind(a,b), aes(x=n, fill=group)) + geom_histogram(position='dodge', bins=100) 令人惊讶的是,这是曼·惠特尼(Mann Whitney)检验(?)无法拒绝样本来自同一总体的原假设: &gt; wilcox.test(n ~ group, rbind(a,b)) Wilcoxon rank …

3
与错误发现率和多重测试相混淆(在Colquhoun上,2014年)
我读过David Colquhoun的这篇出色论文:对错误发现率和对p值的误解的调查(2014年)。从本质上讲,他解释了为什么即使我们将I型错误控制在,错误发现率(FDR)仍可以高达。30%30%30\%α=0.05α=0.05\alpha=0.05 但是,对于在多次测试中应用FDR控制会发生什么,我仍然感到困惑。 说,我已经对许多变量中的每一个进行了测试,并使用Benjamini-Hochberg过程计算了。我得到一个对有意义的变量。我问这个发现是什么FDR?qqqq=0.049q=0.049q=0.049 我可以安全地假设,从长远来看,如果我定期进行此类分析,则FDR不是,而是低于,因为我使用了Benjamini-Hochberg?这感觉是错误的,我想说值对应于Colquhoun论文中的值,并且他的推理也适用于此,因此使用阈值可能会“ 冒充自己”(如在的案件中,Colquhoun表示。但是,我试图更正式地解释它,但失败了。30%30%30\%5%5%5\%qqqpppqqq0.050.050.0530%30%30\%

2
弹性/脊线/套索分析,然后呢?
我对预测器收缩/选择的弹性网程序真的很感兴趣。似乎非常强大。 但是从科学的角度来看,我不知道一旦获得系数该怎么办。我在回答什么问题?这些是对结果有最大影响的变量,并且是在验证过程中提供最佳方差/偏差比的系数吗? 与经典的p值/置信区间方法相比,这当然是一种非常具有描述性/预测性的方法。Tibshirani&Co.现在正在研究推论估计,但仍处于实验阶段。 某些人正在使用弹性网选择的变量来进行经典的推理分析,但这将消除该技术带来的方差限制。 另一个问题是,由于通过交叉验证选择了弹性网的lambda和alpha参数,因此它们具有随机可变性。因此,每次运行(例如)cv.glmnet()时,您将选择系数始终略有不同的预测变量子集。 我通过考虑将正确的lambda和alpha作为随机变量来解决此问题,然后重新运行交叉验证步骤n次以获取这些参数的分布。这样,对于每个预测变量,我将具有出现的次数,对于每个系数,我将具有结果的分布。这应该为我提供范围统计信息(如系数的sd)更通用的结果。观察以这种方式选择的lambda和alpha是否渐近地近似也很有趣,因为这将为进行推理测试开辟道路(但我不是统计学家,所以我不应该谈论我不喜欢的事情完全不了解)。 所以最后我的问题是:一旦从具有基于交叉验证的alpha和lambda的弹性网中获得了预测变量和系数,应该如何显示这些结果?您应该如何讨论它们?我们学到了什么?我们可以混淆哪个假设/概括?

1
我如何找到统计表中未给出的值?
人们通常使用程序来获取p值,但有时出于某种原因(可能出于某种原因)可能需要从一组表中获取临界值。 给定具有有限数量的显着性水平和有限数量的自由度的统计表,我如何在其他显着性水平或自由度下获得近似临界值(例如使用,卡方或表) ?tŤtFFF 也就是说,如何在表中的值之间找到“值”?

1
是否进行统计检验以比较两个大小为1和3的样本?
对于一个生态项目,我的实验室小组将醋添加到4个装有等量池塘水的水箱,1个无伊乐藻的对照(一种水生植物)和3个各含相同伊乐藻的处理液中。添加醋的目的是降低pH。假设是装有伊乐藻的水箱会更快地回到其正常pH值。确实是这样。我们每天测量每个水箱的pH值大约两个星期。最终所有的水箱都恢复到其自然pH值,但是对于装有伊乐藻的水箱,这花费的时间要短得多。 当我们告诉教授我们的实验设计时,他说没有可以对数据进行统计学检验以将对照与治疗进行比较的统计检验。那是因为对照没有重复项(我们只使用了一个对照槽),所以无法计算方差,因此无法比较对照和处理的样本均值。所以我的问题是,这是真的吗?我绝对明白他的意思。例如,如果您仅举一男一女的身高,就无法得出有关他们各自人口的结论。但是我们做了3种治疗,差异很小。假设控制中的方差相似是合理的吗? 更新: 感谢您的出色回答。我们从湿地中获得了更多的水和伊乐藻,并决定我们将再次使用较小的水箱进行实验,但是这次使用了5个对照和5种处理方法。我们将把它与原始数据结合起来,但是水箱的起始pH值足够不同,以至于认为新实验是从与原始实验相同的种群中采样似乎无效。 我们考虑添加不同数量的伊乐藻,并尝试将pH修复的速度(以直到pH恢复至其原始值所需的时间来衡量)与伊乐藻的数量相关联,但我们认为这是不必要的。我们的目的仅是表明伊乐藻具有积极的作用,而并非针对pH对不同数量的伊乐藻的确切反应建立某种预测模型。确定最佳的伊乐藻数量,但这可能只是可以存活的最大数量。由于增加大量社区时会发生各种复杂的变化,因此尝试对数据拟合回归曲线不会特别有意义。电极死亡,分解,新生物开始占主导地位,依此类推。

2
当数据不是正态分布时,如何测试两组均值之间的差异?
我将消除所有生物学上的细节和实验,只引用眼前的问题以及我在统计学上所做的事情。我想知道它是否正确,如果不正确,如何进行。如果数据(或我的解释)不够清楚,我将尝试通过编辑来更好地解释。 假设我有两个组/观测值X和Y,大小分别为和N y = 40。我想知道这两个观察的平均值是否相等。我的第一个问题是:ñX= 215Nx=215N_x=215ñÿ= 40Ny=40N_y=40 如果满足假设,在这里使用参数两样本t检验是否有意义?我问这是因为据我了解,通常在尺寸较小时使用它吗? 我绘制了X和Y的直方图,并且它们不是正态分布的,这是两次样本t检验的假设之一。我的困惑是,我认为它们是两个人口,这就是为什么我检查正态分布。但是接下来我要进行两次样本t检验... 是吗? 根据中心极限定理,我了解到如果您多次执行抽样(根据人口规模是否进行重复)并每次计算样本平均值,那么样本将近似呈正态分布。并且,此随机变量的均值将很好地估计总体均值。因此,我决定在X和Y上执行此操作1000次,并获得样本,然后为每个样本的平均值分配一个随机变量。情节是非常正态分布的。X和Y的平均值分别为4.2和15.8(与总体+-0.15相同),方差分别为0.95和12.11。 我对这两个观测值(每个有1000个数据点)进行了t检验,它们具有不相等的方差,因为它们有很大差异(0.95和12.11)。零假设被拒绝了。 这有道理吗?这种正确/有意义的方法还是两个样本的z检验足够了还是完全错误的? 为了确保(在原始X和Y上)我也执行了非参数Wilcoxon检验,并且在那里也令人信服地拒绝了原假设。如果我以前的方法完全错误,我认为进行非参数检验是好的,除了统计功效之外? 在两种情况下,均值均存在显着差异。但是,我想知道这两种方法中的一种还是两种都是错误的/完全错误的,如果是,那有什么替代方法?

3
有人解决了PTLOS练习4.1吗?
埃德温·杰恩斯(Edwin Jaynes)于2003年在《概率论:科学的逻辑》中给出了该练习。此处有部分解决方案。我已经制定了一个更通用的局部解决方案,并且想知道是否有人解决了它。在发布答案之前,我将稍等片刻,让其他人受益。 好的,假设我们有互斥且详尽的假设,表示为。进一步假设我们有m个数据集,用D_j \; \;(j = 1,\ dots,m)表示。第i个假设的似然比由下式给出:Ñ ħ 我nn(i = 1 ,… ,n )Hi(i=1,…,n)H_i \;\;(i=1,\dots,n)m mmD j(j = 1 ,… ,m )Dj(j=1,…,m)D_j \;\;(j=1,\dots,m) L R (H i)= P (D 1 D 2 … ,D m | H i)P (d 1 d 2 ... ,d 米 | &OverBar; ħ我)LR(Hi)=P(D1D2…,Dm|Hi)P(D1D2…,Dm|H¯¯¯¯¯i)LR(H_{i})=\frac{P(D_{1}D_{2}\dots,D_{m}|H_{i})}{P(D_{1}D_{2}\dots,D_{m}|\overline{H}_{i})} 请注意,这些是条件概率。现在假设给定第i个假设^ …

2
学生考试是沃尔德考试吗?
学生考试是沃尔德考试吗? 我已经从Wasserman的《All Statistics》中阅读了Wald测试的描述。 在我看来,Wald检验包括t检验。那是对的吗?如果不是,那么什么使t检验而不是Wald检验?

1
为什么要完全使用ANOVA而不是直接进行事后或计划中的比较测试?
考虑到群体之间的方差分析情况,您首先实际进行这样的ANOVA测试,然后进行事后(Bonferroni,Šidák等)或计划的比较测试,您会得到什么?为什么不完全跳过ANOVA步骤? 我认为在这种情况下,组间ANOVA的一个好处是能够使用Tukey的HSD作为事后测试。后者需要ANOVA表中的组内均方来计算其相关的标准误差。但是,对不成对t检验的Bonferroni和Šidák调整不需要任何方差分析输入。 我想就小组内部方差分析的情况提出同样的问题。我知道在这种情况下,Tukey的HSD测试不是一个相关的考虑因素,这使得这个问题更加紧迫。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.