Questions tagged «pareto-distribution»





1
防止帕累托平滑重要性抽样(PSIS-LOO)失败
我最近开始使用帕累托平滑重要性抽样留一法交叉验证(PSIS-LOO),这些论文对此进行了介绍: Vehtari,A.&Gelman,A.(2015年)。帕累托平滑重要性抽样。arXiv预印本(链接)。 Vehtari,A.,Gelman,A.,&Gabry,J.(2016年)。使用留一法交叉验证和WAIC的实用贝叶斯模型评估。arXiv预印本(链接) 这代表了一种非常好的样本外模型评估方法,因为它允许通过一次MCMC运行就可以执行LOO-CV,并且据称比现有的信息标准(例如WAIC)更好。 k^ik^i\hat{k}_ik^i≳0.7k^i≳0.7\hat{k}_i \gtrsim 0.7 不幸的是,我发现在将该方法应用于问题时,对于大多数感兴趣的模型,我发现的很大一部分。毫不奇怪,一些报告的LOO对数似然显然是毫无意义的(与其他数据集相比)。作为双重检查,我执行了传统的(且费时的)10倍交叉验证,发现确实在上述情况下,PSIS-LOO给出了非常错误的结果(从正面来看,结果与10所有的模型的CV。作为记录,我使用的是Aki Vehtari的PSIS-LOO 的MATLAB实现。k^i≫0.7k^i≫0.7\hat{k}_i \gg 0.7k^i≪0.7k^i≪0.7\hat{k}_i \ll 0.7 也许我很倒霉,因为我目前应用此方法的第一个问题对PSIS-LOO来说“困难”,但是我怀疑这种情况可能相对普遍。对于像我这样的案例,Vhttary,Gelman&Gabry的论文简单地说: 即使PSIS估计具有有限的方差,当,用户也应考虑针对有问题的直接从进行采样,请使用倍交叉验证,或使用更可靠的模型。k^>0.7k^>0.7\hat{k} > 0.7p(θs|y−i)p(θs|y−i)p(\theta^s |y_{−i})iiikkk 这些是显而易见的但不是真正理想的解决方案,因为它们都很费时或需要额外的摆弄(我很欣赏MCMC 和模型评估都是摆弄,但越少越好)。 我们是否可以预先应用任何常规方法来尝试防止 PSIS-LOO失败?我有一些初步的想法,但我想知道人们是否已经采用了经验方法。

3
如何从数据样本中估计Zipf截断分布的参数?
我对Zipf的估算参数有问题。我的情况如下: 我有一个样本集(从产生应遵循Zipf分布的调用的实验中测得)。我必须证明此生成器确实会生成带有zipf分发的调用。我已经阅读了此问答,如何从一组最高频率中计算Zipf定律系数?但由于使用了截短的分布,所以结果很差。例如,如果我在生成过程中将“ s”值设置为“ 0.9”,则如果我尝试估算报告的“问题与答案”中所写的“ s”值,那么我将获得等于0.2 ca的“ s”。我认为这是由于我使用了TRUNCATED发行版(我必须用截断点来限制zipf,它被右截断了)。 如何使用截断的zipf分布估算参数?

3
中心极限定理和帕累托分布
有人可以提供有关帕累托分布和中心极限定理之间关系的简单解释(例如,适用吗?为什么/为什么不呢?)?我试图理解以下陈述: “中心极限定理不适用于所有分布。这是由于一个偷偷摸摸的事实-样本均值聚集在基础分布的均值周围(如果存在的话)。但是分布如何没有均值呢?帕累托分布没有任何意义。如果您尝试使用通常的方法进行计算,则它会发散到无穷大。”
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.