这个单一值与该分布相符吗?


10

这似乎是一个非常幼稚的问题,但我很难看到答案。

我有一组30个值。我独立地获得了第31个值。空假设是第31个值是同一分布的一部分。另一种选择是,它与众不同。我想要某种p值或可能性度量。

我有一些想法:

  • 这类似于想要进行两个样本的t检验-除了对于第二个样本,我只有一个值,并且30个值不一定呈正态分布。
  • 如果我有30个测量值而不是30个测量值,则单个测量值的等级可以提供一些有用的信息。

如何计算这种可能性或p值?

谢谢!亚尼克


4
您要求一个预测间隔。您的第二个想法导致了非参数预测间隔(我相信以前没有在此站点上提及)。
Whuber

您还能向我们介绍一下您的人口吗?所有价值观都是积极的吗?您希望它是对称的吗?单峰?
soakley 2013年

谢谢和道歉,我应该提供更多的信息。我们正在查看预测间隔。基本上,我们有一个焦点基因预测的长度。并在数据库中找到相似基因的长度。因此,所有数字均为正整数。在简单的情况下,长度的分布是单峰的。实际上,他们经常不满意。在这个阶段,我们可以假设它们是。这里显示了一些分布图:github.com/monicadragan/gene_prediction/tree/master/…–
Yannick Wurm

我不确定我们想要一个“预测间隔”,我们不想预测...,我们也不想间隔...?
Yannick Wurm 2013年

1
不要过度解释技术术语。根据定义,“预测间隔”由值构成,使得在所有假定联合分布下,第31个值位于内的机会等于给定目标,例如95%。如果实际上第31个值不在内,则您可能会得出以下结论:(i)您很不幸(在您收集数据之前,只有5%的机会发生),或者(ii)实际上不是如果第31个值具有您假设的分布:这就是您要测试的值。一世3031一世一世
whuber

Answers:


7

在单峰情况下,Vysochanskij-Petunin不等式可以给您一个粗略的预测区间。这是Wikipedia网站:http : //en.wikipedia.org/wiki/Vysochanski%C3%AF%E2%80%93Petunin_inequality

使用将导致大约95%的预测间隔。λ=3

因此,您可以估算总体的均值和标准差,并仅使用样本均值正负作为间隔。X¯3s

这种方法存在两个问题。您真的不知道平均值或标准偏差。您正在使用估算值。通常,您将没有单峰分布,这意味着您将不得不使用Chebyshev不等式的专门版本。但是至少您有一个起点。

对于一般情况,Konijn(1987年2月的美国统计师)指出,订单统计可以用作预测间隔。因此,是的预测间隔,Konijn称之为大小大小定义为“该间隔将覆盖取值的概率的最大下限(关于所接受的联合分布集)”。使用这种方法,93.6%的预测间隔为[X一世XĴ]XĴ-一世ñ+1个X[X1个X30]

他还给出了一种归因于Saw,Yang和Mo的方法:有关文章覆盖范围的详细信息。

[X¯-λ1个+1个ñ1个/2s  X¯+λ1个+1个ñ1个/2s]

例如,如果使用将使覆盖率超过90%。ñ=30λ=3.2


这似乎是对不等式的错误应用:它假设均值和方差已知,其中方差只能根据此上下文中的数据进行估算。差异可能很大,尤其是对于小型数据集。在对具有切比雪夫不等式的类似提议进行的模拟研究中,我发现性能异常差。从直觉上讲,这类似于学生的见解,即在构造CI时应使用t分布而不是正态分布。因为PI的尾部“更远”,所以差异被放大了。
ub

2
重新编辑(+1):非参数预测间隔可以理解为iid无效假设下的置换检验。在这种情况下,第31个值是所有31个值中的最大值或最小值的机会只有%。相关测试得出的结论是,第31个值最小或最大时与其他30个不一致。该测试的大小(通常而言)为%。它是使用30个数据值进行(双面)测试所能达到的最小尺寸。2/316.456.45
ub

1

我有一些想法:

这类似于想要进行两个样本的t检验-除了对于第二个样本,我只有一个值,并且30个值不一定呈正态分布。

正确。这个想法有点像带有单个值的t检验。由于分布是未知的,只有30个数据点的正态性可能有点难以理解,因此需要进行某种非参数测试。

如果我有30个测量值而不是30个测量值,则单个测量值的等级可以提供一些有用的信息。

即使进行了30次测量,排名也可以提供参考。

正如@whuber指出的那样,您需要某种预测间隔。对于非参数情况,您实际上要问的是:给定数据点偶然获得我们为您进行的第31次测量所观察到的排名的概率是多少?

这可以通过简单的置换测试来解决。这是一个具有15个值和一个比第一个值大的小说(第16个观察值)的示例:

932
915
865
998
521
462
688
1228
746
433
662
404
301
473
647

new value: 1374

我们执行N个排列,列表中元素的顺序被重新排列,然后问一个问题:(重新排列)列表中第一个元素的值的等级是多少?

执行N = 1,000个排列将为我们提供608种情况,其中列表中第一个元素的等级等于或大于新值的等级(实际上相等,因为新值是最好的)。再次运行模拟以进行1000个排列,我们得到658个这种情况,然后是663个...

如果我们执行N = 1,000,000个排列,我们将获得62825个案例,其中列表中第一个元素的等级等于或优于新值的等级(进一步的模拟给出62871个案例,然后是62840个……)。如果取满足条件的情况与排列总数之间的比率,我们得到的数字为0.062825、0.062871、0.06284 ...

您可以看到这些值收敛到1/16 = 0.0625(6.25%),正如@whuber所指出的那样,这是随机抽取的给定值(从16个中抽取)在其中可能具有最佳排名的可能性。

对于新数据集,其中新值是次佳值(即等级2):

6423
8552
6341
6410
6589
6134
6500
6746
8176
6264
6365
5930
6331
6012
5594

new value: 8202

我们得到(对于N = 1,000,000个排列):125235、124883 ...有利的情况,该情况再次近似表示随机抽取的给定值(从16个中选出)在其中排名第二的可能性:2/16 = 0.125(12.5%)。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.