Questions tagged «p-value»

在常识假设检验中, p-值是在假设无效的假设为真的情况下,结果大于或大于观察结果的概率。

8
在没有假设的情况下P值的丰度
我正在流行病学。我不是统计学家,但尽管经常遇到困难,但我还是尝试自己进行分析。大约2年前,我做了第一次分析。从描述表到回归分析,P值被包括在我的分析中的所有地方(我只是做了其他研究人员所做的事情)。渐渐地,在我公寓里工作的统计学家说服我跳过所有(!)p值,除非我真正有一个假设。 问题在于,p值在医学研究出版物中很丰富。通常在太多行上都包含p值;平均值,中位数或其他通常带有p值的描述性数据(学生t检验,卡方等)。 我最近向期刊提交了一篇论文,但我拒绝(礼貌地)在我的“基准”描述性表中添加p值。该文件最终被拒绝。 例如,请参见下图;这是一本受人尊敬的内科杂志上最新发表的文章的描述性表格: 统计人员大部分(如果不是总是)参与这些手稿的审阅。因此,像我这样的外行人希望在没有假设的情况下找不到任何p值。但是它们很丰富,但是对于我来说,其原因仍然难以捉摸。我发现很难相信这是无知。 我意识到这是一个临界的统计问题。但我正在寻找这种现象背后的原因。

1
自由度可以是非整数吗?
当我使用GAM时,它给了我剩余的DF为(代码的最后一行)。这意味着什么?超越GAM示例,通常,自由度可以是非整数吗?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 1.2445 6.0516 (Dispersion Parameter for gaussian family taken to be 6.6717) Null Deviance: 1126.047 on 31 degrees of freedom Residual Deviance: 177.4662 on 26.6 degrees of …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

3
是什么导致发布的p值在p <.05处不连续?
在最近的一篇论文中,Masicampo和Lalande(ML)收集了许多不同研究中发表的大量p值。他们观察到p值直方图在标准临界值5%处出现了奇怪的跳跃。 Wasserman教授的博客上有一个关于ML现象的精彩讨论: http://normaldeviate.wordpress.com/2012/08/16/p-values-gone-wild-and-multiscale-madness/ 在他的博客上,您将找到直方图: 由于5%水平是惯例而不是自然法则,是什么导致已发布p值的经验分布的这种行为? 选择偏差,正好在规范临界水平之上的p值的系统“调整”,还是什么?



4
Ziliak(2011)反对使用p值,并提到了一些替代方案。这些是什么?
在最近的一篇文章中讨论了依赖p值进行统计推断的缺点,称为“ Matrixx诉Siracusano和Student诉Fisher的审判统计意义”(DOI:10.1111 / j.1740-9713.2011.00511.x), Stephen T. Ziliak反对使用p值。在最后几段中,他说: 数据是我们已经知道并且肯定的一件事。我们实际上想知道的是完全不同的东西:给定我们拥有的数据,假设成立的可能性为真(或至少在实践中有用)。我们想知道两种药物不同的可能性,以及在给定证据的情况下相差多少。显着性检验(基于转置条件的谬误,即Fisher陷入的陷阱)不会,也无法告诉我们这种可能性。幂函数,预期损失函数以及许多其他的决策理论方法和贝叶斯方法都可以从Student和Jeffreys继承而来,这些方法现已广泛可用并且可以免费在线使用。 幂函数,期望损失函数和“其他决策理论和贝叶斯方法”是什么?这些方法是否被广泛使用?它们在R中可用吗?这些新建议方法如何实施?例如,我将如何使用这些方法在数据集中检验我的假设,否则我将使用常规的两样本t检验和p值?

3
健全性检查:p值可以走多低?
我正在使用ranksum检验来比较两个样本的中位数(),发现它们与显着不同。我应该对这么小的值感到怀疑还是应该将其归因于与非常大的样本相关的高统计能力?有任何可疑的低值之类的东西吗?n = 120000ñ=120000n=120000p = 1.12E-207pppppp

4
Stouffer的Z评分方法:如果我们将
我正在使用相同的原假设进行独立的统计检验,并希望将结果合并为一个NNN值。似乎有两种“可接受的”方法:Fisher方法和Stouffer方法。ppp 我的问题是关于斯托弗的方法。对于每个单独的测试,我都获得z得分。在零假设下,它们中的每一个都具有标准正态分布,因此和∑ z i遵循方差N的正态分布。因此斯托夫的方法表明计算Σ ž 我/ √ziziz_iΣziΣzi\Sigma z_iNNN,应该以单位方差正态分布,然后将其用作联合z得分。Σzi/N−−√Σzi/N\Sigma z_i / \sqrt{N} 这是合理的,但是这是我想出的另一种方法,对我来说也很合理。由于每个的来自一个标准正态分布,平方和小号= Σ ž 2 我应来自与卡方分布Ñ自由度。因此,可以使用具有N个自由度的累积卡方分布函数来计算S并将其转换为p值(p = 1 - X N(S ),其中X N是CDF)。ziziz_iS=Σz2iS=Σzi2S=\Sigma z^2_iNNNSSSpppNNNp=1−XN(S)p=1−XN(S)p=1−X_N(S)XNXNX_N 但是,我什至找不到这种方法。有没有用过?它有名字吗?与斯托弗的方法相比,优点/缺点是什么?还是我的推理有缺陷?


4
相关性假设与显着性回归斜率检验之间的假设差异
我的问题来自与@whuber的讨论,涉及另一个问题的评论。 具体来说,@ whuber的评论如下: 您可能会感到惊讶的一个原因是,相关检验和回归斜率检验所基于的假设是不同的,因此,即使我们了解到相关性和斜率确实在衡量同一事物,为什么它们的p值也应该相同?这表明,与简单地确定和在数值上是否相等相比,这些问题要深得多。β[R[Rrββ\beta 这引起了我的思考,我遇到了许多有趣的答案。例如,我发现了这个问题“ 相关系数的假设 ”,但是看不到如何澄清上面的评论。 我在简单的线性回归中找到了有关Pearson的和斜率的关系的更有趣的答案(例如,请参见此处和此处),但它们似乎都没有回答@whuber在他的评论中所指的内容(至少不明显)。对我来说)。β[R[Rrββ\beta 问题1:相关性检验和回归斜率检验的假设是什么? 对于我的第二个问题,请考虑以下输出R: model &lt;- lm(Employed ~ Population, data = longley) summary(model) Call: lm(formula = Employed ~ Population, data = longley) Residuals: Min 1Q Median 3Q Max -1.4362 -0.9740 0.2021 0.5531 1.9048 Coefficients: Estimate Std. Error t value Pr(&gt;|t|) (Intercept) 8.3807 4.4224 1.895 …

3
比较和对比,p值,显着性水平和I型错误
我想知道是否有人可以简要介绍p值的定义和使用,显着性水平和I类错误。 我了解p值的定义是“获得至少与我们实际观察到的数据一样极端的测试统计信息的概率”,而显着性水平只是用来衡量p值是否有意义的任意临界值。 。I类错误是拒绝原假设为零的错误。但是,我不确定重要性级别和I类错误之间的区别,这是不是一个相同的概念? 例如,假设有一个非常简单的实验,我将硬币掷1000次并计算它落在“头”上的次数。我的零假设H0是正面= 500(无偏硬币)。然后,将我的显着性水平设置为alpha = 0.05。 我将硬币翻转1000次,然后计算p值,如果p值&gt; 0.05,则我无法拒绝原假设,如果p值&lt;0.05,则我拒绝原假设。 现在,如果我重复进行此实验,每次计算p值,或者拒绝或未能拒绝原假设,并保持对我拒绝/失败拒绝的计数,那么我最终将拒绝5%的原假设实际上是正确的,对吗?这是类型I错误的定义。因此,如果执行重复实验,Fisher重要性检验中的重要性水平实质上就是Neyman-Pearson假设检验中的I型错误。 现在关于p值,如果我从上一个实验中获得了0.06的p值,并且我进行了多次实验并计算了所有从0到0.06得到p值的值,那么我也将没有拒绝真实零假设的可能性为6%?

3
p值0.04993是否足以拒绝原假设?
在Wilcoxon符号秩统计显着性检验中,我们遇到了一些数据,得出值为。在的阈值下,此结果是否足以拒绝原假设,还是更安全地说该检验没有结论,因为如果将p值四舍五入到小数点后三位,则它变为?0.04993 p &lt; 0.05 0.050ppp0.049930.049930.04993p &lt; 0.05p&lt;0.05p < 0.050.0500.0500.050

4
相互比较p值有什么意义?
我有两个人口(男人和女人),每个人口包含样本。对于每个样本,我都有两个属性A和B(第一年平均成绩和SAT分数)。我分别对A和B使用了t检验:两者都发现两组之间存在显着差异。A(和B(。p = 0.008 p = 0.002100010001000p = 0.008p=0.008p=0.008p = 0.002p=0.002p=0.002 可以断言属性B比属性A更好地被识别(更重要)吗?还是t检验只是是或否(有效或无效)度量? 更新:根据这里的评论以及我在Wikipedia上所读的内容,我认为答案应该是:删除无意义的p值并报告效果大小。有什么想法吗?

3
与错误发现率和多重测试相混淆(在Colquhoun上,2014年)
我读过David Colquhoun的这篇出色论文:对错误发现率和对p值的误解的调查(2014年)。从本质上讲,他解释了为什么即使我们将I型错误控制在,错误发现率(FDR)仍可以高达。30%30%30\%α=0.05α=0.05\alpha=0.05 但是,对于在多次测试中应用FDR控制会发生什么,我仍然感到困惑。 说,我已经对许多变量中的每一个进行了测试,并使用Benjamini-Hochberg过程计算了。我得到一个对有意义的变量。我问这个发现是什么FDR?qqqq=0.049q=0.049q=0.049 我可以安全地假设,从长远来看,如果我定期进行此类分析,则FDR不是,而是低于,因为我使用了Benjamini-Hochberg?这感觉是错误的,我想说值对应于Colquhoun论文中的值,并且他的推理也适用于此,因此使用阈值可能会“ 冒充自己”(如在的案件中,Colquhoun表示。但是,我试图更正式地解释它,但失败了。30%30%30\%5%5%5\%qqqpppqqq0.050.050.0530%30%30\%

1
在R(nnet程序包)中获取“ multinom”的p值
如何使用package中的multinom函数获取p值?nnetR 我有一个数据集,其中包含作为结果变量的“病理学评分”(不存在,轻度,严重)和两个主要影响:年龄(两个因素:二十天/三十天)和治疗组(四个因素:感染者没有ATB;感染者+ ATB1;已感染+ ATB2;已感染+ ATB3)。 首先,我尝试拟合序数回归模型,鉴于我的因变量(序数)的特征,这似乎更合适。但是,(图形上)严重违反了赔率比例的假设,这促使我改用多项式模型,而是使用nnet软件包。 首先,我选择了需要用作基线类别的结果级别: Data$Path &lt;- relevel(Data$Path, ref = "Absent") 然后,我需要为自变量设置基线类别: Data$Age &lt;- relevel(Data$Age, ref = "Twenty") Data$Treat &lt;- relevel(Data$Treat, ref="infected without ATB") 该模型: test &lt;- multinom(Path ~ Treat + Age, data = Data) # weights: 18 (10 variable) initial value 128.537638 iter 10 value 80.623608 final …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.