这似乎是一个非常幼稚的问题,但我很难看到答案。
我有一组30个值。我独立地获得了第31个值。空假设是第31个值是同一分布的一部分。另一种选择是,它与众不同。我想要某种p值或可能性度量。
我有一些想法:
- 这类似于想要进行两个样本的t检验-除了对于第二个样本,我只有一个值,并且30个值不一定呈正态分布。
- 如果我有30个测量值而不是30个测量值,则单个测量值的等级可以提供一些有用的信息。
如何计算这种可能性或p值?
谢谢!亚尼克
这似乎是一个非常幼稚的问题,但我很难看到答案。
我有一组30个值。我独立地获得了第31个值。空假设是第31个值是同一分布的一部分。另一种选择是,它与众不同。我想要某种p值或可能性度量。
我有一些想法:
如何计算这种可能性或p值?
谢谢!亚尼克
Answers:
在单峰情况下,Vysochanskij-Petunin不等式可以给您一个粗略的预测区间。这是Wikipedia网站:http : //en.wikipedia.org/wiki/Vysochanski%C3%AF%E2%80%93Petunin_inequality
使用将导致大约95%的预测间隔。
因此,您可以估算总体的均值和标准差,并仅使用样本均值正负作为间隔。
这种方法存在两个问题。您真的不知道平均值或标准偏差。您正在使用估算值。通常,您将没有单峰分布,这意味着您将不得不使用Chebyshev不等式的专门版本。但是至少您有一个起点。
对于一般情况,Konijn(1987年2月的美国统计师)指出,订单统计可以用作预测间隔。因此,是的预测间隔,Konijn称之为大小大小定义为“该间隔将覆盖取值的概率的最大下限(关于所接受的联合分布集)”。使用这种方法,93.6%的预测间隔为
他还给出了一种归因于Saw,Yang和Mo的方法:有关文章覆盖范围的详细信息。
例如,如果使用将使覆盖率超过90%。
我有一些想法:
这类似于想要进行两个样本的t检验-除了对于第二个样本,我只有一个值,并且30个值不一定呈正态分布。
正确。这个想法有点像带有单个值的t检验。由于分布是未知的,只有30个数据点的正态性可能有点难以理解,因此需要进行某种非参数测试。
如果我有30个测量值而不是30个测量值,则单个测量值的等级可以提供一些有用的信息。
即使进行了30次测量,排名也可以提供参考。
正如@whuber指出的那样,您需要某种预测间隔。对于非参数情况,您实际上要问的是:给定数据点偶然获得我们为您进行的第31次测量所观察到的排名的概率是多少?
这可以通过简单的置换测试来解决。这是一个具有15个值和一个比第一个值大的小说(第16个观察值)的示例:
932
915
865
998
521
462
688
1228
746
433
662
404
301
473
647
new value: 1374
我们执行N个排列,列表中元素的顺序被重新排列,然后问一个问题:(重新排列)列表中第一个元素的值的等级是多少?
执行N = 1,000个排列将为我们提供608种情况,其中列表中第一个元素的等级等于或大于新值的等级(实际上相等,因为新值是最好的)。再次运行模拟以进行1000个排列,我们得到658个这种情况,然后是663个...
如果我们执行N = 1,000,000个排列,我们将获得62825个案例,其中列表中第一个元素的等级等于或优于新值的等级(进一步的模拟给出62871个案例,然后是62840个……)。如果取满足条件的情况与排列总数之间的比率,我们得到的数字为0.062825、0.062871、0.06284 ...
您可以看到这些值收敛到1/16 = 0.0625(6.25%),正如@whuber所指出的那样,这是随机抽取的给定值(从16个中抽取)在其中可能具有最佳排名的可能性。
对于新数据集,其中新值是次佳值(即等级2):
6423
8552
6341
6410
6589
6134
6500
6746
8176
6264
6365
5930
6331
6012
5594
new value: 8202
我们得到(对于N = 1,000,000个排列):125235、124883 ...有利的情况,该情况再次近似表示随机抽取的给定值(从16个中选出)在其中排名第二的可能性:2/16 = 0.125(12.5%)。