Questions tagged «confidence-interval»

置信区间是一个以置信度覆盖未知参数的区间。置信区间是一个经常性的概念。它们经常与可靠的时间间隔混淆,后者是贝叶斯模型。 (1α)%


12
为什么95%的置信区间(CI)并不意味着95%的机会包含平均值?
似乎在这里通过各种相关问题,我们达成共识,即所谓的“ 95%置信区间”中的“ 95%”部分是指这样的事实:如果我们要多次精确地重复采样和CI计算过程, ,因此计算得出的95%的配置项将包含总体平均值。这也似乎是共识,这一定义确实不允许人们从单个95%CI得出结论,即平均值有95%的概率落在CI内。但是,我不理解前者在暗示许多95%的配置项包含总体均值的情况下并不暗示后者,就我们的不确定性而言(关于我们实际计算的配置项是否包含总体)是不是)强迫我们使用想象中的案例的基准利率(95%)作为我们对实际案例包含CI的概率的估计? 我见过一些文章按照“实际计算的CI包含总体均值或不包含总体均值,因此其概率为1或0”的论点进行争论,但这似乎暗示了对概率依赖性的奇怪定义在未知状态下(例如,一个朋友扔公平的硬币,隐藏结果,我被禁止说有50%的可能性是正面的)。 我当然错了,但是我看不出逻辑哪里出错了...

3
“天真启动”失败的例子有哪些?
假设我有一组来自未知或复杂分布的样本数据,并且我想对数据的统计量进行一些推断。我的默认倾向是只生成一堆带有替换的引导程序样本,并在每个引导程序样本上计算我的统计量,以为创建一个估计分布。TTTTTTTTT 有哪些不好的主意示例? 例如,如果天真的执行此引导程序将失败,则是一种情况,如果我尝试对时间序列数据使用引导程序(例如,测试我是否具有显着的自相关)。我认为上述天真的引导程序(通过对原始序列进行替换并进行采样来生成第n个引导程序样本系列的第个数据点)是不明智的,因为它忽略了我的原始时间序列中的结构,因此我们获得更先进的引导程序技术,例如块引导程序。iii 换句话说,除了“替换抽样”之外,引导程序还有什么?

9
确切地说,置信区间是多少?
我大致和非正式地知道什么是置信区间。但是,我似乎无法围绕一个相当重要的细节:根据Wikipedia: 置信区间不能预测给定实际获得的数据,参数的真实值具有置信区间内的特定概率。 我还在该站点的多个地方也看到了类似的观点。同样来自维基百科的更正确的定义是: 如果在重复(可能不同)实验的许多单独数据分析中构建置信区间,则包含参数真实值的此类区间的比例将大致与置信度匹配 同样,我在该站点的多个地方也看到了类似的观点。我不明白 如果在重复实验中,包含真实参数的计算出的置信区间的分数为,那么为实际实验计算出的置信区间中的概率怎么可能不是吗?我在寻找以下内容:(1 - α )θ (1 - α )θθ\theta(1−α)(1−α)(1 - \alpha)θθ\theta(1−α)(1−α)(1 - \alpha) 澄清以上错误定义和正确定义之间的区别。 对置信区间的正式,精确的定义,清楚地表明了第一个定义错误的原因。 即使基础模型正确,但第一个定义明显错误的情况的具体示例。

6
是否有任何例子表明贝叶斯可信区间明显不如常识性置信区间
最近关于置信度和可信区间之间的差异的问题使我开始重新阅读Edwin Jaynes关于该主题的文章: Jaynes,ET,1976年。《置信区间与贝叶斯区间》,《概率论,统计推论和科学的统计理论基础》,WL Harper和CA Hooker(编),D。Reidel,Dordrecht,第1页。175; (pdf) Jaynes在摘要中写道: ...我们展示了贝叶斯和正统解对涉及置信区间的六个常见统计问题(包括基于相同推理的显着性检验)。在每种情况下,我们都发现情况恰好相反,即贝叶斯方法更易于应用,并且产生相同或更好的结果。实际上,仅当正统结果与贝叶斯结果紧密(或完全一致)时,其结果才令人满意。尚未产生相反的例子。 (强调我的) 该论文于1976年发表,所以也许情况有所发展。我的问题是,是否有一些例子表明,频繁主义者的置信区间明显优于贝叶斯可信区间(根据Jaynes的隐含挑战)? 基于错误的先验假设的示例是不可接受的,因为它们没有说明不同方法的内部一致性。


4
心理学杂志禁止使用p值和置信区间;停止使用它们确实明智吗?
2015年2月25日,《基本与应用社会心理学》杂志 发表社论,禁止所有未来论文发表和置信区间。ppp 他们具体说(格式和重点是我的): [...]在发表之前,作者将必须删除NHSTP [无效假设重要性检验程序]的所有痕迹(,,,有关“重大”差异的陈述或缺乏它们的陈述) , 等等)。ppptttFFF 类似于NHSTP如何无法提供原假设的概率(需要为原假设提供强有力的条件来拒绝它),置信区间并不能为推断所关注的总体参数可能在规定范围内提供强有力的条件。间隔。因此,BASP也禁止置信区间。 [...]关于贝叶斯程序,我们保留根据具体情况做出判断的权利,因此,BASP也不要求也不禁止贝叶斯程序。 [...]是否需要任何推论统计程序?- 否,但是,BASP将需要强大的描述性统计数据,包括效应量。 让我们在这里不讨论问题和滥用。浏览p值标记可以找到很多有关CV的精彩讨论。对的批判常常与建议一起报告感兴趣参数的置信区间有关。例如,在这个非常有争议的答案中, @ gung建议以周围的置信区间来报告效果大小。但是该杂志也禁止置信区间。pppppp 与采用,置信区间和显着/无关紧要的二分法的“传统”方法相比,这种呈现数据和实验结果的方法的优缺点是什么?对该禁令的反应似乎主要是消极的。那有什么缺点呢?美国统计协会甚至对该禁令发表了简短的令人沮丧的评论,称“该政策可能有其自身的负面影响”。这些负面后果可能是什么?ppp 还是正如@whuber建议的那样,这种方法是否应该被普遍提倡为定量研究的范例?如果没有,为什么不呢? PS。请注意,我的问题与禁令本身无关;这是关于建议的方法。我也不是在问频率论者和贝叶斯论者。《社论》对贝叶斯方法也相当否定。因此本质上是关于使用统计信息与根本不使用统计信息。 其他讨论:reddit,Gelman。

8
生成与现有变量具有定义的相关性的随机变量
对于模拟研究,我必须生成随机变量,这些变量显示与现有变量的预定义(填充)相关性。ÿYY 我研究了这些R软件包copula,CDVine它们可以生成具有给定依赖关系结构的随机多变量分布。但是,不可能将结果变量之一固定为现有变量。 任何想法和现有功能的链接表示赞赏! 结论: 提出了两个有效的答案,有不同的解决方案: 一个R 脚本由卡拉卡尔,其计算与一个随机变量精确(样品)的相关性,以一个预定义的变量 我发现了一个R 函数,该函数计算与预定义变量具有定义的总体相关性的随机变量 [@ttnphns的补充:我可以自由地将问题标题从单个固定变量的情况扩展到任意数量的固定变量;即如何生成具有预定义正确性和一些固定的现有变量的变量]

2
线性回归中预测值的置信区间形状
我注意到,线性回归中预测值的置信区间在预测器的平均值附近趋于狭窄,在预测器的最小值和最大值附近趋于胖。这可以从以下4个线性回归的图中看出: 我最初认为这是因为大多数预测变量的值都集中在预测变量的均值附近。但是,我然后注意到,即使许多的值集中在预测变量的极值附近,也会出现置信区间的狭窄中间,如左下方线性回归所示,预测变量的哪些值集中在预测值的最小值附近。预测变量。 有谁能解释为什么线性回归预测值的置信区间在中间趋于狭窄而在极端处趋于肥胖?

3
解释xkcd软糖漫画:是什么使它有趣?
我看到一个超时它们运行的20次总的测试,,所以他们错误地认为,二十测试之一中,其结果是显著(0.05 = 1 / 20)。p&lt;0.05p&lt;0.05p < 0.050.05=1/200.05=1/200.05 = 1/20 xkcd果冻豆漫画-“重要” 标题:重要 悬停文字:“所以,呃,我们再次进行了绿色研究,但没有任何联系。这可能是-''研究发现冲突于绿色果冻豆/痤疮链接;建议进行更多研究!”

4
是否在95%置信区间内的所有值均具有相同的可能性?
我在以下问题上发现了不一致的信息:“ 如果构建了均值差异或比例差异的95%置信区间(CI),则CI中的所有值是否均等可能?或者,该点估计是否最有可能,与CI的“尾部”相近的值是否比CI的中间值小? 例如,如果一项随机临床试验报告指出,采用特定治疗的相对死亡风险为1.06(95%CI为0.96至1.18),则0.96的正确值是否等于1.06? 我在网上找到了很多关于此概念的参考,但是以下两个示例反映了其中的不确定性: 丽莎·沙利文(Lisa Sullivan)关于置信区间的模块指出: 均值差异的置信区间提供了()可能值的范围。重要的是要注意,置信区间中的所有值都是(μ_1-μ_2)真实值的估计值。μ1−μ2μ1−μ2μ_1-μ_2μ1−μ2μ1−μ2μ_1-μ_2 这篇标题为“ 误差范围之内”的博客文章指出: 我想到的是对“误差范围”的误解,该误差范围将置信区间内的所有点均等地对待,好像中心极限定理暗示了有界均匀分布而不是t分布。[...] 谈论“误差范围”遗漏的是,接近点估计的可能性要比位于边缘的可能性大得多。” 这些似乎是矛盾的,那么哪个是正确的?


6
随机森林模型的预测是否具有预测间隔?
如果运行randomForest模型,则可以基于该模型进行预测。有没有一种方法可以获取每个预测的预测间隔,以使我知道模型如何“确定”其答案。如果可能的话,是仅仅基于整个模型的因变量的可变性,还是根据特定预测所遵循的特定决策树,其间隔会变宽还是变窄?

6
如何使用R中的ROC曲线确定最佳截止点及其置信区间?
我有一项测试数据,可用于区分正常细胞和肿瘤细胞。根据ROC曲线,此目的看起来不错(曲线下的面积为0.9): 我的问题是: 如何确定该测试的临界点及其置信区间,在该区间应该将读数判断为不明确? 可视化此最佳方法(使用ggplot2)是什么? 图是使用ROCR和ggplot2包呈现的: #install.packages("ggplot2","ROCR","verification") #if not installed yet library("ggplot2") library("ROCR") library("verification") d &lt;-read.csv2("data.csv", sep=";") pred &lt;- with(d,prediction(x,test)) perf &lt;- performance(pred,"tpr", "fpr") auc &lt;-performance(pred, measure = "auc")@y.values[[1]] rd &lt;- data.frame(x=perf@x.values[[1]],y=perf@y.values[[1]]) p &lt;- ggplot(rd,aes(x=x,y=y)) + geom_path(size=1) p &lt;- p + geom_segment(aes(x=0,y=0,xend=1,yend=1),colour="black",linetype= 2) p &lt;- p + geom_text(aes(x=1, y= 0, hjust=1, …

1
Bootstrap与Jackknife
引导法和折刀法都可以用来估计估计值的偏差和标准误差,并且两种重采样方法的机制也没有很大的不同:一次替换采样与一次不进行观察。但是,折刀在研究和实践中不像自举法那样受欢迎。 使用引导程序而不使用折刀刀有明显的优势吗?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.