我是统计学的新手(一些初学者的Uni课程),并且想知道是否从未知分布中进行采样。具体来说,如果您不了解基本分布,是否有任何方法可以“保证”获得代表性样本?
举例说明:假设您试图弄清楚财富的全球分布。对于任何给定的个人,您都可以以某种方式找出他们的确切财富;但您无法“采样”地球上的每个人。因此,假设您随机抽样了n = 1000个人。
如果您的样本中不包括比尔·盖茨,您可能会认为不存在亿万富翁。
如果您的样本确实包括比尔·盖茨,您可能会认为亿万富翁比他们实际更为普遍。
无论哪种情况,您都无法真正分辨出亿万富翁的普通或罕见。您甚至可能根本无法判断是否存在任何内容。
对于这种情况,是否存在更好的采样机制?
您如何告诉先验使用哪种采样程序(以及需要多少个样本)?
在我看来,您可能必须“抽样”大量人口,以某种合理的确定性来了解地球上有多少普通或稀有的亿万富翁,这是由于基本的分布有点困难跟...共事。